导语
内容提要
智能体与多智能体系统是人工智能领域活跃的研究分支,其涉及的基本研究问题包括合作协调、推理规划、学习、工具框架、模型等。本书的内容遴选自2015年及2016年度“中国智能体及多智能体系统”研讨会的特邀报告,同时收集了部分学者的*新研究进展。全书共计11个专题,每个专题均是智能体领域的重点及热点问题,分别涉及:多智能体学习、多智能体协调协商、多智能体规划、多智能体应用框架及工具以及交叉应用基础问题研究。 王崇骏、史忠植、常亮、王文剑主编的《多智能体系统及应用(卷2)》可供高等院校、科研院所计算机、自动化及相关专业的师生、科技工作者及相关企业的工程技术人员阅读参考。
目录
专题1 智能体动机学习 史忠植,马刚,李建清
1 概述
2 动机理论
3 动机学习
4 基于动机的强化学习
5 小结
参考文献
专题2 多智能体强化学习中的博弈、均衡和知识迁移 胡裕靖,高阳
1 绪论
2 背景知识
3 不共享值函数的多智能体强化学习
4 基于均衡迁移的多智能体强化学习
5 稀疏交互的多智能体系统中的知识迁移和博弈约简
6 小结
参考文献
专题3 一种基于中介agent的强化学习优化协商方法 陈利红,董红斌
1 引言
2 基于强化学习的双边多议题优化协商模型
3 基于中介agent自适应学习的协调协商
4 实验设计与分析
5 小结
参考文献
专题4 多智能体协调技术综述 郝建业
1 引言
2 固定对手重复博弈
3 合作式群体博弈
4 非合作式群体博弈
5 小结
参考文献
专题5 基于决策理论的多智能体规划 吴锋
1 引言
2 分布式局部可观察马尔可夫决策过程(DEC-POMDP)
3 DEC-POMDP的离线规划算法
4 DEC-POMDP的在线规划算法
5 小结
参考文献
专题6 部分可观察环境中的序贯决策理论及方法研究 章宗长
1 引言
2 部分可观察马尔可夫决策过程
3 离线规划方法
4 在线规划方法
5 基于覆盖数的规划理论
6 小结
参考文献
专题7 基于Landmark的启发式搜索规划 张雷,吴骏,王崇骏
1 引言
2 STRIPS规划问题
3 STRIPS问题的启发式函数设计
4 多值Landmark规划
5小结
参考文献
专题8 AutoRobot:基于多主体系统的自主机器人软件框架 毛新军,杨硕,杨森
1 引言
2 自主机器人及其软件特点
3 机器人软件技术分析
4 基于多主体系统的自主机器人软件体系结构
5 自主机器人软件框架AutoRobot
6 案例分析
7小结
参考文献
专题9 计算经济学与最优机制设计问题 唐平中
1 计算经济学简介
2 最优机制设计问题:单件商品
3 最优机制设计:多件商品
4 小结
参考文献
专题10 基于计算博弈论的出租车服务定价研究 甘家瑞,安波
1 研究背景与相关工作
2 博弈建模
3 模型求解——紧凑表达法
4 ASM算法——基于元时间表的紧凑表达
5 解决任意约束下的问题
6 实验
7 小结
参考文献
专题11 云计算中定价机制的研究 秦涛
1 云计算简介
2 云计算中的定价模型
3 市场竞争、演变与定价策略优化
4 小结
参考文献