搜索到123 篇“ 再励学习 “的相关文章
基于再 励 学习 的交流调速系统模糊神经网络控制 被引量:1 2011年 针对矢量控制交流调速系统,该文提出并设计了一种基于再 励 学习 的模糊神经网络速度控制器。详细介绍了基于遗传算法的神经网络权重在线训练方法,仿真对比了输入空间的划分即模糊子集数量对模糊神经网络控制器的训练及其控制效果的影响。仿真结果表明该速度控制器能通过在线训练方式获得最优参数以适应被控对象的参数变化,能使系统获得优良的动态和静态性能。 杨威 赵金 张华军关键词:模糊神经网络 遗传算法 再励学习 交流调速 基于遗传算法和神经网络预测的再 励 学习 被引量:7 2010年 提出一种基于遗传算法和神经网络预测法相结合的再 励 学习 方法,利用遗传算法对全局进行最优解搜索,将进化过程中产生的数据用来训练神经网络预测器,当再 励 学习 逼近最优解时,利用预测网络估计动作网络的参数、结构与系统响应之间的映射关系,用预测网络逼近最优解的能力引导遗传算法在局部向最优解快速逼近,以解决遗传算法局部振荡问题,从而实现快速学习 的能力。将其应用于矢量控制交流电机的速度环控制器自学习 中,仿真实验验证了该算法的有效性。 张华军 赵金关键词:再励学习 遗传算法 神经网络预测 矢量控制 基于多机器人系统的避碰规划再 励 学习 研究 随着机器人技术的发展,机器人的能力不断提高,其应用领域不断扩展,人们要求机器人所完成的任务也越来越复杂,于是人们考虑由多个机器人组成的群体系统通过协调、协作来完成单机器人无法或难以完成的工作。多移动机器人系统中的机器人工... 唐英关键词:多机器人系统 避碰规划 再励学习 文献传递 再 励 学习 及其在移动机器人行为规划中的应用2009年 再 励 学习 (Reinforcement Learning,RL)是一种成功地结合动态编程和控制问题的机器智能方法,它将动态编程和有监督学习 方法结合到机器学习 系统中,通常用于解决预测和控制两类问题。提出了以矢量形式表示的评估函数,为了实现多维再 励 学习 ,用一专门的神经网络(Q网络)实现评判网络,研究其在移动机器人行为规划中的应用。 林雄 于洪 孙志雄 韩建文关键词:再励学习 神经网络 智能机器人 基于再 励 学习 的被动动态步行机器人 被引量:8 2008年 为了研究仿人、能量高效的双足机器人步行,研制了由MACCEPA(mechanically adjustable compliance and controllable equilibrium position actuator)柔性驱动器驱动的半被动双足机器人,并实现了其动力学仿真系统。提出一种基于再 励 学习 的步行控制方法。该方法首先采用Q-学习 方法学习 机器人在理想环境中的稳定步行步态及其控制策略,然后将此步态和控制策略作为模糊优胜学习 方法的参考步态和参考控制策略并在线学习 模糊网络的优胜值参数。仿真结果表明:利用学习 训练的结果控制柔性驱动器在步行相转换时的动作,机器人可以实现稳定动态步行。 毛勇 李实 王家廞 贾培发 杨泽红 丘振关键词:机器人 双足机器人 再励学习 基于角色跟踪的再 励 学习 算法 针对现有再 励 学习 策略在群体对抗环境中,收敛速度慢,无法动态改变学习 步伐,难以准确收敛至最优点的问题,本文提出了一种基于角色跟踪的再 励 学习 算法。该算法借助MAS对抗系统中Agent角色异构特性,判断对手角色与动作的匹配度,... 陈箭锋 张志涌文献传递 结构化状态空间中的递阶再 励 学习 方法 2007年 在状态空间满足结构化条件的前提下,通过状态空间的维度划分直接将复杂的原始MDP问题递阶分解为一组简单的MDP或SMDP子问题,并在线对递阶结构进行完善.递阶结构中嵌入不同的再 励 学习 方法可以形成不同的递阶学习 .所提出的方法在具备递阶再 励 学习 速度快、易于共享等优点的同时,降低了对先验知识的依赖程度,缓解了学习 初期回报值稀少的问题. 孟江华 朱纪洪 孙增圻半被动双足机器人的设计与再 励 学习 控制 被动动态步行是双足步行研究领域中的一个重要分支,其研究目的是对于步行现象本质特性的发掘,研究手段包括步态合成和步态分析方法。其中,步态合成方法通过研制机器人实体的方式,将研究者感兴趣的步行特性逐步引入机器人,它强调对于步... 毛勇关键词:双足机器人 再励学习 文献传递 飞行器姿态的再 励 学习 跟踪控制 针对飞行器姿态系统讨论了飞行器的俯仰姿态跟踪问题.将再 励 学习 神经网络引入飞行器姿态系统,通过内部再 励 信号在线修改控制器参数来达到预期的控制效果.在保证姿态系统对实时性要求的前提下,对原有的再 励 学习 方法进行适当改进,改进后... 沈超 井元伟关键词:飞行器 再励学习 神经网络控制 文献传递 飞行器姿态的再 励 学习 跟踪控制 针对飞行器姿态系统讨论了飞行器的俯仰姿态跟踪问题.将再 励 学习 神经网络引入飞行器姿态系统,通过内部再 励 信号在线修改控制器参数来达到预期的控制效果.在保证姿态系统对实时性要求的前提下,对原有的再 励 学习 方法进行适当改进,改进后...关键词:飞行器 再励学习 神经网络 跟踪控制 文献传递 网络资源链接
相关作者
石纯一 作品数:180 被引量:2,194 H指数:26 供职机构:清华大学信息科学技术学院计算机科学与技术系 研究主题:人工智能 多AGENT系统 AGENT MAS 分布式人工智能 张双民 作品数:7 被引量:21 H指数:4 供职机构:清华大学信息科学技术学院计算机科学与技术系 研究主题:再励学习 AGENT 语义模型 多AGENT系统 测试床 林良明 作品数:140 被引量:902 H指数:18 供职机构:上海交通大学 研究主题:机器人 内窥镜 移动机器人 小波变换 微机器人 程振波 作品数:186 被引量:248 H指数:10 供职机构:浙江工业大学 研究主题:向量表示 车辆 知识图谱 向量 三元组 张芳 作品数:136 被引量:367 H指数:11 供职机构:辽宁工程技术大学 研究主题:岩石 地下空间 SUB 数值模拟 近红外光谱