公共文化服务平台

2025年3月27日星期四

|

欢迎来到维普•公共文化服务平台

登录 | 进入后台

搜索到123篇“ 再励学习“的相关文章

基于再励学习的交流调速系统模糊神经网络控制被引量：1: 2011年; 针对矢量控制交流调速系统,该文提出并设计了一种基于再励学习的模糊神经网络速度控制器。详细介绍了基于遗传算法的神经网络权重在线训练方法,仿真对比了输入空间的划分即模糊子集数量对模糊神经网络控制器的训练及其控制效果的影响。仿真结果表明该速度控制器能通过在线训练方式获得最优参数以适应被控对象的参数变化,能使系统获得优良的动态和静态性能。; 杨威赵金张华军; 关键词：模糊神经网络遗传算法再励学习交流调速

基于遗传算法和神经网络预测的再励学习被引量：7: 2010年; 提出一种基于遗传算法和神经网络预测法相结合的再励学习方法,利用遗传算法对全局进行最优解搜索,将进化过程中产生的数据用来训练神经网络预测器,当再励学习逼近最优解时,利用预测网络估计动作网络的参数、结构与系统响应之间的映射关系,用预测网络逼近最优解的能力引导遗传算法在局部向最优解快速逼近,以解决遗传算法局部振荡问题,从而实现快速学习的能力。将其应用于矢量控制交流电机的速度环控制器自学习中,仿真实验验证了该算法的有效性。; 张华军赵金; 关键词：再励学习遗传算法神经网络预测矢量控制

基于多机器人系统的避碰规划再励学习研究: 随着机器人技术的发展，机器人的能力不断提高，其应用领域不断扩展，人们要求机器人所完成的任务也越来越复杂，于是人们考虑由多个机器人组成的群体系统通过协调、协作来完成单机器人无法或难以完成的工作。多移动机器人系统中的机器人工...; 唐英; 关键词：多机器人系统避碰规划再励学习; 文献传递

再励学习及其在移动机器人行为规划中的应用: 2009年; 再励学习(Reinforcement Learning,RL)是一种成功地结合动态编程和控制问题的机器智能方法,它将动态编程和有监督学习方法结合到机器学习系统中,通常用于解决预测和控制两类问题。提出了以矢量形式表示的评估函数,为了实现多维再励学习,用一专门的神经网络(Q网络)实现评判网络,研究其在移动机器人行为规划中的应用。; 林雄于洪孙志雄韩建文; 关键词：再励学习神经网络智能机器人

基于再励学习的被动动态步行机器人被引量：8: 2008年; 为了研究仿人、能量高效的双足机器人步行,研制了由MACCEPA(mechanically adjustable compliance and controllable equilibrium position actuator)柔性驱动器驱动的半被动双足机器人,并实现了其动力学仿真系统。提出一种基于再励学习的步行控制方法。该方法首先采用Q-学习方法学习机器人在理想环境中的稳定步行步态及其控制策略,然后将此步态和控制策略作为模糊优胜学习方法的参考步态和参考控制策略并在线学习模糊网络的优胜值参数。仿真结果表明:利用学习训练的结果控制柔性驱动器在步行相转换时的动作,机器人可以实现稳定动态步行。; 毛勇李实王家廞贾培发杨泽红丘振; 关键词：机器人双足机器人再励学习

基于角色跟踪的再励学习算法: 针对现有再励学习策略在群体对抗环境中，收敛速度慢，无法动态改变学习步伐，难以准确收敛至最优点的问题，本文提出了一种基于角色跟踪的再励学习算法。该算法借助MAS对抗系统中Agent角色异构特性，判断对手角色与动作的匹配度，...; 陈箭锋张志涌; 文献传递

结构化状态空间中的递阶再励学习方法: 2007年; 在状态空间满足结构化条件的前提下,通过状态空间的维度划分直接将复杂的原始MDP问题递阶分解为一组简单的MDP或SMDP子问题,并在线对递阶结构进行完善.递阶结构中嵌入不同的再励学习方法可以形成不同的递阶学习.所提出的方法在具备递阶再励学习速度快、易于共享等优点的同时,降低了对先验知识的依赖程度,缓解了学习初期回报值稀少的问题.; 孟江华朱纪洪孙增圻

半被动双足机器人的设计与再励学习控制: 被动动态步行是双足步行研究领域中的一个重要分支,其研究目的是对于步行现象本质特性的发掘,研究手段包括步态合成和步态分析方法。其中,步态合成方法通过研制机器人实体的方式,将研究者感兴趣的步行特性逐步引入机器人,它强调对于步...; 毛勇; 关键词：双足机器人再励学习; 文献传递

飞行器姿态的再励学习跟踪控制: 针对飞行器姿态系统讨论了飞行器的俯仰姿态跟踪问题．将再励学习神经网络引入飞行器姿态系统,通过内部再励信号在线修改控制器参数来达到预期的控制效果．在保证姿态系统对实时性要求的前提下,对原有的再励学习方法进行适当改进,改进后...; 沈超井元伟; 关键词：飞行器再励学习神经网络控制; 文献传递

飞行器姿态的再励学习跟踪控制: 针对飞行器姿态系统讨论了飞行器的俯仰姿态跟踪问题.将再励学习神经网络引入飞行器姿态系统,通过内部再励信号在线修改控制器参数来达到预期的控制效果.在保证姿态系统对实时性要求的前提下,对原有的再励学习方法进行适当改进,改进后...; 关键词：飞行器再励学习神经网络跟踪控制; 文献传递网络资源链接

加载更多 ∨

相关作者

石纯一: 作品数：180被引量：2,194H指数：26; 供职机构：清华大学信息科学技术学院计算机科学与技术系; 研究主题：人工智能多AGENT系统 AGENT MAS 分布式人工智能

张双民: 作品数：7被引量：21H指数：4; 供职机构：清华大学信息科学技术学院计算机科学与技术系; 研究主题：再励学习 AGENT 语义模型多AGENT系统测试床

林良明: 作品数：140被引量：902H指数：18; 供职机构：上海交通大学; 研究主题：机器人内窥镜移动机器人小波变换微机器人

程振波: 作品数：186被引量：248H指数：10; 供职机构：浙江工业大学; 研究主题：向量表示车辆知识图谱向量三元组

张芳: 作品数：136被引量：367H指数：11; 供职机构：辽宁工程技术大学; 研究主题：岩石地下空间 SUB 数值模拟近红外光谱