搜索到754篇“ 多AGENT学习“的相关文章
一种层次黑板模型的Agent学习系统的研究
2021年
本文主要对一种Agent学习系统进行了研究,设计并实现了一种智能协作学习原型系统,具体基于黑板模型完成了学习系统的构造,通过黑板模型和Agent技术的综合运用实现了个Agent间的通信与学习过程。运行测试结果表明该系统的基本协作学习功能均得以有效实现,具有较高的智能化水平,能够将更高质量、更高效的服务提供给学生。
顾明
关键词:智能性黑板模型多AGENT
基于Agent学习机制的服务组合
2013年
服务Agent能够利用本身的功能以及来自外部的个软件服务,向外界提供更为高层的服务。为了向用户提供综合的功能,服务Agent之间必须通过相互协同实现服务组合。提出了一种依靠Agent学习机制进行服务组合的方法,其独特性在于通过学习,这些Agent能够对类似的输入迅速得到优化解。对基于Agent协同进行服务组合的框架进行了介绍,在此基础上详细说明了如何利用Agent学习机制进行服务组合,并对相关的实验进行了介绍。
赵海燕曹健徐文博
关键词:服务AGENT多AGENT学习
基于联合博弈的Agent学习
2011年
在研究Q-Learning算法的基础上,将博弈论中的团队协作理论引入到强化学习中,提出了一种基于联合博弈的Agent学习算法。该算法通过建立个阶段博弈,根据回报矩阵对阶段博弈的结果进行评估,为其提供一种有效的A-gent行为决策策略,使每个Agent通过最优均衡解或观察协作Agent的历史动作和自身当前情况来预测其所要执行的动作。对任务调度问题进行仿真实验,验证了该算法的收敛性。
黄付亮张荣国陈大川刘焜
关键词:AGENTMAS
基于变学习率的agent学习算法的研究
2009年
对在动态学习的环境中的IGA算法做了研究,改进了梯度方向上的步长恒定不变的不足,引入了变学习率,并介绍了调节学习率的方法——WoLF原则,加速其收敛。最后根据该方法,对Q学习算法做了改进,并通过仿真试验证明了算法的有效性。
李琳娜
关键词:多AGENT学习Q学习
一般和博弈中的合作agent学习被引量:9
2007年
理性和收敛是agent学习研究所追求的目标,在理性合作的agent系统中提出利用Pareto占优解代替非合作的Nash平衡解进行学习,使agent更具理性,另一方面引入社会公约来启动和约束agent的推理,统一系统中所有agent的决策,从而保证学习的收敛性.利用2人栅格游戏对种算法进行验证,成功率的比较说明了所提算法具有较好的学习性能.
宋梅萍顾国昌张国印刘海波
关键词:多AGENT学习NASH平衡PARETO占优Q-学习
一种基于agent学习的电子市场智能定价方法被引量:1
2007年
B2B电子市场的定价问题是一个半学习半推理的连续决策过程,每个定价agent不是直接采用agent学习算法下的均衡策略,而是根据博弈历史进行推理决策,并不断学习对手的策略。提出了基于内省推理方法的agent环境下agent高效在线学习方法,将基于对手模型的客观观察行为与基于换位思考推理的主观意图推测结合起来。仿真结果证实了算法在电子市场定价中的有效性。
韩伟王云吕捷
关键词:多AGENT系统电子市场
基于DFL的agent学习模型研究
Agent学习是近年来广泛受到人们关注的热点问题之一。针对agent学习过程中,agent本身属性以及环境所存在的动态模糊性特点,本文基于动态模糊逻辑/(DFL/),给出了一种agent学习模型,包括agent心智模型...
谢丽萍
关键词:多AGENT系统动态模糊逻辑
文献传递
基于学习分类器系统的agent学习研究
agent系统,尤其是agent学习方法,近年来有长足的发展,在解决很实际问题中取得了很好的应用效果。但是随着研究的深入,agent学习领域也迎来了新的挑战。agent系统可扩展能力在agent学习研究中具有...
陶那日苏
关键词:多AGENT学习进化算法数据挖掘
跨层认知无线Mesh网络中agent学习的功率分配策略被引量:2
2015年
为了改善无线Mesh网络的无线电频谱的利用效率以及提高能源利用效率,提出跨层认知无线Mesh网络中agent学习的功率分配策略。首先,通过agent智能学习方法,将网络状态定位为一个有限状态马尔可夫决策过程,在环境状态变化时,通过任务来学习一个优化策略,最大化网络的资源和能量的总期望收益。其次,为了更好地节省网络能量,通过一种奖励机制和非合作博弈模式正式确定功率的分配问题,在每个环境状态下学习到最佳的功率分配策略。最后,实验仿真结果表明,该算法在提高频谱利用效率和能源效率上具有明显的效果。
李跃新杨岗
Agent MDPs中并行Rollout学习算法
2014年
文章在rollout算法基础上研究了在Agent MDPs的学习问题.利用神经元动态规划逼近方法来降低其空间复杂度,从而减少算法"维数灾".由于Rollout算法具有很强的内在并行性,文中还分析了并行求解方法.通过级仓库库存控制的仿真试验,验证了Rollout算法在Agent学习中的有效性.
李豹
关键词:ROLLOUT算法神经元动态规划多AGENT学习性能势

相关作者

王长缨
作品数:23被引量:114H指数:6
供职机构:国防科学技术大学信息系统与管理学院管理系
研究主题:多主体系统 多AGENT系统 强化学习方法 人工智能 多AGENT协作
陈大川
作品数:5被引量:15H指数:2
供职机构:太原科技大学计算机科学与技术学院
研究主题:HARRIS SSDA NCC 雪景 归一化互相关
杨岗
作品数:2被引量:4H指数:2
供职机构:湖北大学计算机与信息工程学院
研究主题:非合作 跨层 多AGENT学习 多AGENT 系统上位机
江道平
作品数:15被引量:24H指数:3
供职机构:北京科技大学
研究主题:AGENT 感知 人工鱼 人工生命 行为动画
谢俊元
作品数:197被引量:1,098H指数:15
供职机构:南京大学
研究主题:计算机网络 向量 入侵检测 网络安全 数据挖掘