购物车
我的订单
我的账号
帮助
全文搜索
全文搜索
商品名
作者
出版社
ISBN
立即搜索
高级搜索
使用帮助
首 页
本周新书
本月新书
热点销售
畅销排行
每周排行
每月排行
澳洲库存
商品分类
图书
>
文学书店
>
经管书店
>
社科书店
>
艺术书店
>
教育书店
>
时尚生活
>
IT 技 术
>
建筑书店
>
科技书店
>
医药书店
>
少儿书店
影音
>
流行音乐店
>
世界音乐店
>
中国民乐店
>
影视音乐店
>
戏曲艺术店
>
电影
>
连续剧
>
教学
>
儿童
>
生活百科
共有
2
个搜索结果
得意时看淡失意时看开
所属分类:
哲 学
>>
哲 学
>>
伦理学
作者:
编者:
郑一
出版社:
中国纺织
人生的许多痛苦皆因心态使然。在这喧嚣纷扰的 俗世之中,只有淡然看待,坦然面对,心不为世俗所 扰,身不为物欲所驱,一切随缘,顺其自然,懂得看 开,我们才能找回生活原本的快乐。郑一编著的《得 意时看淡失意时看开》从得失、荣辱、情绪、诱惑、 淡薄、宽心、随缘、看开等方面,对做人要有淡然之 心,看开之念进行阐述,并配以饶有寓意的哲理故事 ,给读者以启迪,帮助读者完善自己,创造幸福人生 。
售价:
14.72
深度强化学习算法原理与实战(基于MATLAB)
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
编者:
郑一
|责编:张赛//耍利娜
出版社:
化学工业
本书在详细阐述强化学 习基本概念与基本理论的基 础上,循序渐进地介绍了深 度强化学习各常用算法的基 本思想、算法伪代码、算法 实现、基于实例的算法演示 与程序分析等内容。具体介 绍了Q-learning算法求解最 优路径问题,SARSA算法求 解最优安全路径问题,策略 迭代算法求解两地租车最优 调度问题,价值迭代算法求 解最优路径问题,DQN算法 求解平衡系统的最优控制问 题,PG算法求解双积分系 统的最优控制问题,AC类 算法求解股票交易的最优推 荐策略,SAC算法求解机器 人手臂控球平衡问题,PPO 算法求解飞行器平稳着陆最 优控制问题,DDPG算法求 解四足机器人行走控制策略 问题,TD3算法求解PID控 制器参数整定问题,多智能 体强化学习的基本概念与基 本方法,MAPPO算法求解 多智能体协作运送物体问题 ,IPPO算法与MAPPO算法 求解协作竞争探索区域问题 ,MADDPG与DDPG算法求 解车辆路径跟踪控制问题。 本书可作为高等院校深 度强化学习课程的教材,亦 可作为本科生毕业设计、研 究生项目设计和广大科研人 员的技术参考用书。
售价:
43.60
共有
2
个搜索结果
共有
1
页
第一页
上一页
下一页
最后页
转到第