全部商品分类

您现在的位置: 全部商品分类 > 数理化学科 > 数理化学科 > 数学

在线凸优化(概念架构及核心算法)/华章数学译丛

  • 定价: ¥69
  • ISBN:9787111690221
  • 开 本:16开 平装
  •  
  • 折扣:
  • 出版社:机械工业
  • 页数:180页
  • 作者:(美)埃拉德·哈赞...
  • 立即节省:
  • 2021-09-01 第1版
  • 2021-09-01 第1次印刷
我要买:
点击放图片

导语

  

内容提要

  

    本书首先讲解在线凸优化的基本概念、架构和核心算法,然后介绍Bandit凸优化、无投影算法和学习理论等高级算法及其与机器学习范式之间的关系。可作为计算机科学、统计学以及相关领域研究生的在线凸优化和凸优化与机器学习结合等课程的教材。

作者简介

    埃拉德·哈赞(Elad Hazan)普林斯顿大学计算机科学教授,谷歌人工智能普林斯顿公司的联合创始人和董事。他专注于机器学习和优化中基本问题的算法设计和分析的研究,曾获得贝尔实验室奖、2008年度和2012年度IBM Goldberg最佳论文奖、欧洲研究理事会奖、玛丽·居里奖学金和谷歌研究奖。他曾在计算学习协会指导委员会任职,并担任COLT2015程序委员会主席,2017年与他人共同创建了致力于高效优化和控制的In8公司。

目录

前言
致谢
第1章  导论
  1.1  在线凸优化模型
  1.2  可以用OCO建模的例子
  1.3  一个温和的开始:从专家建议中学习
    1.3.1  加权多数算法
    1.3.2  随机加权多数算法
    1.3.3  对冲
  1.4  习题
  1.5  文献点评
第2章  凸优化的基本概念
  2.1  基本定义和设定
    2.1.1  在凸集上的投影
    2.1.2  最优条件简介
  2.2  梯度、次梯度下降法
  2.3  非光滑和非强凸函数的归约
    2.3.1  光滑非强凸函数的归约
    2.3.2  强凸非光滑函数的归约
    2.3.3  一般凸函数的归约
  2.4  例子:支持向量机训练
  2.5  习题
  2.6  文献点评
第3章  在线凸优化的一阶算法
  3.1  在线梯度下降法
  3.2  下界
  3.3  对数遗憾
  3.4  应用:随机梯度下降法
  3.5  习题
  3.6  文献点评
第4章  二阶方法
  4.1  动机:通用投资组合选择
    4.1.1  主流投资组合理论
    4.1.2  通用投资组合理论
    4.1.3  持续再平衡投资组合
  4.2  exp-凹函数
  4.3  在线牛顿步算法
  4.4  习题
  4.5  文献点评
第5章  正则化
  5.1  正则函数
  5.2  RFTL算法及其分析
    5.2.1  元算法的定义
    5.2.2  遗憾界
  5.3  在线镜像下降法
    5.3.1  迟缓型OMD算法与RFTL算法的等价性
    5.3.2  镜像下降的遗憾界
  5.4  应用及特殊情形
    5.4.1  在线梯度下降法的导出
    5.4.2  乘法更新的导出
  5.5  随机正则化
    5.5.1  对凸代价函数的扰动
    5.5.2  对线性代价函数的扰动
    5.5.3  专家建议中的扰动领袖追随算法
  5.6  最优正则化(选学)
  5.7  习题
  5.8  文献点评
第6章  Bandit凸优化
  6.1  BCO设定
  6.2  多臂赌博机问题
  6.3  从有限信息到完整信息的归约
    6.3.1  第1部分:使用无偏估计
    6.3.2  第2部分:点点梯度估计
  6.4  不需要梯度的在线梯度下降算法
  6.5  BLO最优遗憾算法(选学)
    6.5.1  自和谐障碍
    6.5.2  一个近优算法
  6.6  习题
  6.7  文献点评
第7章  无投影算法
  7.1  回顾:与线性代数相关的概念
  7.2  动机:矩阵补全与推荐系统
  7.3  条件梯度法
  7.4  投影与线性优化
  7.5  在线条件梯度算法
  7.6  习题
  7.7  文献点评
第8章  博弈、对偶性和遗憾
  8.1  线性规划和对偶性
  8.2  零和博弈与均衡
  8.3  冯·诺伊曼定理的证明
  8.4  近似线性规划
  8.5  习题
  8.6  文献点评
第9章  学习理论、泛化和OCO
  9.1  统计学习理论的设定
    9.1.1  过拟合
    9.1.2  没有免费的午餐
    9.1.3  学习问题的例子
    9.1.4  泛化和可学习性的定义
  9.2  使用OCO的不可知学习
    9.2.1  余项:度量集中和鞅
    9.2.2  对归约的分析
  9.3  习题
  9.4  文献点评
参考文献