人工智能-强化学习 - 程序员宅基地

【人工智能】通俗易懂谈强化学习

标签：人工智能强化学习

王者荣耀AI团队，甚至在顶级期刊AAAI上发表过强化学习在王者荣耀中应用的论文。那么强化学习到底是什么，如何应用的了？下面和大家分享我对于强化学习的整个过程，以及强化学习目前在工业界是如何应用的一些看法，...

人工智能-强化学习-DDPG-demo

标签：人工智能软件/插件

人工智能-强化学习-DDPG-demo,代码可以运行，并详细记录了注释，保证一看就懂

人工智能-项目实践-强化学习-基于强化学习的空战对抗.zip

标签：人工智能强化学习空战对抗

人工智能-项目实践-强化学习-基于强化学习的空战对抗利用值函数逼近网络设计无人机空战自主决策系统，采用epsilon贪婪策略，三层网络结构。其中包含了无人机作为质点时的运动模型和动力学模型的建模。由于无人机...

人工智能-强化学习(1)

在本节中，我们将学习强化学习（Rl）的基础知识，它是机器学习的一个分支，涉及采取一系列动作以使报酬最大化。RL基本上对环境一无所知，而是通过探索环境来学习如何做。它使用动作，并接收状态和奖励。该代理只能...

人工智能-项目实践-强化学习-强化学习股市择时策略实验项目.zip

标签：人工智能股市择时策略强化学习

人工智能-项目实践-强化学习-强化学习股市择时策略实验项目请移步/master文件夹

人工智能-项目实践-强化学习-基于强化学习的五子棋

标签：人工智能强化学习五子棋

人工智能_项目实践_强化学习_基于强化学习的五子棋

人工智能-项目实践-强化学习-使用强化学习来实现旋转门算法参数的自适应

标签：综合资源强化学习自适应旋转门参数

人工智能-项目实践-强化学习-使用强化学习来实现旋转门算法参数的自适应使用强化学习来实现旋转门算法参数的自适应

人工智能：什么是强化学习？

强化学习是人工智能（AI）中讨论最多、关注最多和考虑最多的话题之一，因为它有可能改变大多数企业。什么是强化学习？强化学习的核心是一个概念，即最佳的行为或行动是由积极的回报来强化的。机器和软件代理使用强化...

强化学习-李(O)：综述【Critic--＞Q-Learning算法、Actor/Policy π--＞Policy Gradient算法--off--＞PPO...

标签：人工智能强化学习

这个框架力图简单地表示人工智能问题的若干重要特征，这些特征包含了对因果关系的认知，对不确定性的认知，以及对显式目标存在性的认知。价值与价值函数是强化学习方法的重要特征，价值函数对于策略空间的有效搜索...

人工智能-项目实践-强化学习-用基于策略梯度得强化学习方法训练AI玩王者荣耀.zip

标签：人工智能强化学习 python

人工智能-项目实践-强化学习-用基于策略梯度得强化学习方法训练AI玩王者荣耀一、这个项目由我之前的AI玩王者荣耀项目发展而来。较之前的项目有进步，也更加复杂。用了强化学习的训练方法，并增加了一个判断回报...

人工智能-项目实践-强化学习-基于深度强化学习的资源调度研究.zip

标签：人工智能 tensorflow 强化学习深度学习资源调度

人工智能-项目实践-强化学习-基于深度强化学习的资源调度研究本项目基于hongzimao/deeprm，原作者还著有论文Resource Management with Deep Reinforcement Learning 。原作者使用的神经网络框架是 Theano。但是...

人工智能-机器学习-深度学习-分类与算法梳理

标签：人工智能机器学习算法

目前人工智能的概念层出不穷，容易搞混，理清脉络，有益新知识入脑。

人工智能-项目实践-强化学习-采用强化学习来实现计算卸载.zip

标签：人工智能深度学习强化学习计算卸载

人工智能-项目实践-强化学习-采用强化学习来实现计算卸载采用强化学习来实现计算卸载代码相对比较简单，直接运行即可相对应的论文题目：When Learning Joins Edge: Real-Time Proportional Computation ...

人工智能-强化学习（理解）

标签：人工智能

在强化学习中，智能体通过观察环境的。参与者所作出的一种策略组合，任何参与者单独改变策略都不会得到好处。Q-learning算法直接记录和更新动作-价值函数、静态博弈、动态博弈：参与者同不同时，参与者知不知道。...

人工智能---机器学习

标签：人工智能

除了上述三个主要领域外，人工智能还涉及到其他重要的领域和子领域，例如计算机视觉、自然语言处理、强化学习等2机器学习的基本思路机器学习根据训练方法大致可以分为3大类：监督学习：无监督学习：强化学习：深度...

高级人工智能-强化学习补充部分：棋类游戏的贝尔曼方程1

标签：人工智能游戏

高级人工智能-强化学习补充部分：棋类游戏的贝尔曼方程1

人工智能-项目实践-强化学习-基于深度强化学习的部分计算任务卸载延迟优化.zip

标签：人工智能卸载延迟优化深度学习强化学习

人工智能-项目实践-强化学习-基于深度强化学习的部分计算任务卸载延迟优化 This repository provides the official Tensorflow implementation for the following paper: Intelligent Delay-Aware Partial ...

探索智能新境界：RL4LMs - 强化学习驱动的语言模型

探索智能新境界：RL4LMs - 强化学习驱动的语言模型 ...RL4LMs 是一个创新项目，将强化学习（Reinforcement Learning, RL）与预训练语言模型（Pre-trained Language Models, LMs...这个开源项目由艾伦人工智能研究所（A...

探索智能世界：DRLib - 强化学习库的利器

在这个数字化的时代，强化学习（Reinforcement Learning, RL）作为人工智能的一个重要分支，正在逐步改变我们对机器智能的理解和应用。今天，我要向大家推荐一款开源的强化学习库——DRLib，它是一个强大的工具，...

人工智能-项目实践-强化学习-Code for paper 基于多智能体深度强化学习的车联网通信资源分配优化.zip

标签：人工智能网络通信资源分配强化学习车联网

This is the source code for our paper: 基于多智能体深度强化学习的车联网通信资源分配优化. A brief introduction of this work is as follows: 无线网络的高速发展为车联网提供了更好的支持，但是如何为高速...

人工智能-项目实践-强化学习-基于深度强化学习的原神自动钓鱼A

标签：源码软件强化学习原神钓鱼

人工智能-项目实践-强化学习-基于深度强化学习的原神自动钓鱼A Introduction 现已支持不同分辨率屏幕原神自动钓鱼AI由YOLOX, DQN两部分模型组成。使用迁移学习，半监督学习进行训练。模型也包含一些使用opencv...

DRL圣经2024最新-强化学习:导论第二版

标签：神经网络自然语言处理人工智能

自这本书的第一版出版以来的20年里，人工智能取得了巨大的进步，这在很大程度上是由机器学习的进步推动的，包括强化学习的进步。尽管令人印象深刻的计算能力是这些进步的原因之一，但理论和算法方面的新发展也在推动...

【探索AI】六-AI（人工智能）-强化学习

标签：人工智能

AI

人工智能-项目实践-强化学习-基于深度强化学习的MEC计算卸载与资源分配.zip

标签：人工智能深度学习强化学习计算卸载资源分配

人工智能-项目实践-强化学习-基于深度强化学习的MEC计算卸载与资源分配基于深度强化学习的MEC计算卸载与资源分配

决胜AI-强化学习实战系列视频课程.txt

标签：决胜AI 实战系列视频强化学习马尔科夫

强化学习简介.mp4 1-2.强化学习基本概念.mp4 1-3.马尔科夫决策过程.mp4 1-4.Bellman方程.mp4 1-5.值迭代求解.mp4 1-6.代码实战求解过程.mp4 1-7.Q-Learning基本原理.mp4 1-8.Q-Learning迭代计算实例....

人工智能-项目实践-强化学习-基于pytorch的强化学习2d机械臂小实验（DDPG算法）.zip

标签： pytorch 人工智能算法强化学习 DDPG算法

基于pytorch的2d机械臂强化学习项目。最近学习莫烦大神的强化学习课程： RL-build-arm-from-scratch1.但是原版提供强化学习代码的基于tensorflow的代码，由于本人相对喜欢pytorch编程，这里提供基于pytorch方案。原...

人工智能-项目实践-强化学习-文本相似度计算模型（双塔）.zip

标签：人工智能文本相似度计算强化学习双塔模型

人工智能-项目实践-强化学习-文本相似度计算模型（双塔）文本相似度计算模型（双塔）

人工智能-项目实践-强化学习-基于pytorch的中文意图识别和槽位填充.zip

标签： pytorch 人工智能中文意图识别槽位填充

人工智能-项目实践-强化学习-基于pytorch的中文意图识别和槽位填充基于pytorch的中文意图识别和槽位填充说明基本思路就是：分类+序列标注（命名实体识别）同时训练。使用的预训练模型：hugging face上的...

决胜AI-强化学习实战系列视频课程

标签：机器学习深度学习

购买课程后，添加小助手微信（微信号：csdnxy68）回复【唐宇迪】进入学习群，获取唐宇迪老师答疑强化学习实战视频培训...后通过让AI自动玩游戏的项目实战实例演示如何实现用强化学习和卷积神经网络打造DQN网络模型。

人工智能AI-图像处理cv-基于强化学习的自动化裁剪

标签：图像处理 pytorch 人工智能强化学习

人工智能AI-图像处理cv-基于强化学习的自动化裁剪

”人工智能-强化学习“ 的搜索结果

【人工智能】通俗易懂谈强化学习

人工智能-强化学习-DDPG-demo

人工智能-项目实践-强化学习-基于强化学习的空战对抗.zip

人工智能-强化学习(1)

人工智能-项目实践-强化学习-强化学习股市择时策略实验项目.zip

人工智能-项目实践-强化学习-基于强化学习的五子棋

人工智能-项目实践-强化学习-使用强化学习来实现旋转门算法参数的自适应

人工智能：什么是强化学习？

强化学习-李(O)：综述【Critic--＞Q-Learning算法、Actor/Policy π--＞Policy Gradient算法--off--＞PPO...

人工智能-项目实践-强化学习-用基于策略梯度得强化学习方法训练AI玩王者荣耀.zip

人工智能-项目实践-强化学习-基于深度强化学习的资源调度研究.zip

人工智能-机器学习-深度学习-分类与算法梳理

人工智能-项目实践-强化学习-采用强化学习来实现计算卸载.zip

人工智能-强化学习（理解）

人工智能---机器学习

高级人工智能-强化学习补充部分：棋类游戏的贝尔曼方程1

人工智能-项目实践-强化学习-基于深度强化学习的部分计算任务卸载延迟优化.zip

探索智能新境界：RL4LMs - 强化学习驱动的语言模型

探索智能世界：DRLib - 强化学习库的利器

人工智能-项目实践-强化学习-Code for paper 基于多智能体深度强化学习的车联网通信资源分配优化.zip

人工智能-项目实践-强化学习-基于深度强化学习的原神自动钓鱼A

DRL圣经2024最新-强化学习:导论第二版

【探索AI】六-AI（人工智能）-强化学习

人工智能-项目实践-强化学习-基于深度强化学习的MEC计算卸载与资源分配.zip

决胜AI-强化学习实战系列视频课程.txt

人工智能-项目实践-强化学习-基于pytorch的强化学习2d机械臂小实验（DDPG算法）.zip

人工智能-项目实践-强化学习-文本相似度计算模型（双塔）.zip

人工智能-项目实践-强化学习-基于pytorch的中文意图识别和槽位填充.zip

决胜AI-强化学习实战系列视频课程

人工智能AI-图像处理cv-基于强化学习的自动化裁剪

推荐文章