全部商品分类

您现在的位置: 全部商品分类 > 电子电脑 > 计算机技术 > 信息处理与专用数据库

自然语言处理从入门到实战

  • 定价: ¥79.8
  • ISBN:9787113266912
  • 开 本:16开 平装
  •  
  • 折扣:
  • 出版社:中国铁道
  • 页数:251页
我要买:
点击放图片

导语

  

内容提要

  

    为了帮助广大爱好自然语言处理(NaturalLanguageProcessing,NLP)技术的读者朋友入门此领域,本书阐述了自然语言处理概况、领域应用、相关处理工具包、相关的机器学习及深度学习模型、文本预处理及文本表征等基础知识,以及具体的自然语言处理任务,包括文本分类、关系抽取、知识图谱、文本摘要、序列标注、机器翻译和聊天系统,同时介绍了自然语言处理技术在学术界以及工业界的发展、应用现状,并为读者们提供了部分面试参考题目。
    本书适合有一定的编程及机器学习基础,想入门自然语言处理,以及想系统了解或准备求职自然语言处理初级岗位的读者阅读。

作者简介

   胡盼盼 自然语言处理工程师,斯特拉斯堡大学计算机语言学硕士,曾任法国科学院(CNRS,Centre National de la Recherche Scientifique)算法研究员,负责过医疗知识图谱、聊天机器人、智能律师系统、文本生成系统等企业级核心项目。

目录

第一部分  了解自然语言处理
第1章  自然语言处理初探
  1.1  自然语言处理概述
    1.1.1  自然语言处理早期发展史
    1.1.2  新世纪的里程碑事件
  1.2  自然语言处理的挑战
    1.2.1  词义消歧
    1.2.2  指代消解
    1.2.3  上下文理解
    1.2.4  语义与语用的不对等
  1.3  自然语言处理的应用领域
    1.3.1  医疗
    1.3.2  教育
    1.3.3  媒体
    1.3.4  金融
    1.3.5  法律
  1.4  自然语言处理的常见工具
    1.4.1  基础任务工具包
    1.4.2  科学计算及机器学习框架
    1.4.3  深度学习框架
  本章小结  
  思考题  
第二部分  自然语言处理核心技术
第2章  自然语言处理与机器学习
  2.1  逻辑回归
    2.1.1  逻辑回归基本原理
    2.1.2  逻辑回归在实践中的注意要点
    2.1.3  逻辑回归的优势与不足
  2.2  朴素贝叶斯
    2.2.1  朴素贝叶斯基本原理
    2.2.2  朴素贝叶斯的类型
    2.2.3  朴素贝叶斯的优势与不足
  2.3  Kmeans算法
    2.3.1  Kmeans算法基本原理
    2.3.2  Kmeans算法实践
    2.3.3  Kmeans算法的优势与不足
  2.4  决策树
    2.4.1  决策树的属性划分
    2.4.2  随机森林的基本原理
    2.4.3  随机森林在应用中的注意细节
  2.5  主成分分析
    2.5.1  梯度上升法解PCA
    2.5.2  协方差矩阵解PCA
    2.5.3  实战PCA
  本章小结  
  思考题  
第3章  自然语言处理与神经网络
  3.1  神经网络初探
    3.1.1  神经元结构
    3.1.2  常见的激活函数
    3.1.3  误差反向传播算法
  3.2  常见的神经网络结构
    3.2.1  多层感知机
    3.2.2  循环神经网络的基本原理
    3.2.3  卷积神经网络的基本原理
    3.2.4  神经网络的优势与不足
  3.3  神经网络算法的改进与提升
    3.3.1  防止过拟合的方法
    3.3.2  训练速度与精度的提高方法
    3.3.3  注意力机制
  本章小结  
  思考题  
第三部分  自然语言处理基本任务
第4章  文本预处理
  4.1  文本预处理的基础项目
    4.1.1  文本规范化
    4.1.2  语义分析
    4.1.3  分词
    4.1.4  文本纠错
  4.2  关键词提取
    4.2.1  基于特征统计
    4.2.2  基于主题模型
    4.2.3  基于图模型
  4.3  数据不平衡的处理
    4.3.1  常见方法
    4.3.2  数据不平衡问题实战
  本章小结  
  思考题  
第5章  文本的表示技术
  5.1  词袋模型
    5.1.1  基于频次的词袋模型
    5.1.2  基于TFIDF的词袋模型
    5.1.3  相关工具的使用
  5.2  Word2Vec词向量
    5.2.1  Word2Vec的基本原理
    5.2.2  Word2Vec模型细节及代码演示
    5.2.3  应用工具训练Word2Vec
  5.3  改进后的词表征
    5.3.1  GloVe模型
    5.3.2  FastText模型
    5.3.3  ELMo模型
  5.4  句向量
    5.4.1  基于词向量的平均
    5.4.2  沿用Word2Vec思想
    5.4.3  有监督方式
  本章小结  
  思考题  
第6章  序列标注
  6.1  序列标注基础
    6.1.1  序列标注的应用场景
    6.1.2  基线方式
    6.1.3  序列标注任务的难点
  6.2  基于概率图的模型
    6.2.1  隐马尔科夫模型(HMM)
    6.2.2  最大熵马尔科夫模型(MEMM)
    6.2.3  条件随机场模型(CRF)
    6.2.4  天气预测实例
  6.3  基于深度学习的方式
    6.3.1  数据表征形式
    6.3.2  序列处理模型
  本章小结  
  思考题  
第7章  关系抽取
  7.1  关系抽取基础
    7.1.1  关系抽取概述
    7.1.2  关系抽取的主要方法
    7.1.3  深度学习与关系抽取
    7.1.4  强化学习与关系抽取
  7.2  基于半监督的关系抽取模式:Snowball系统
    7.2.1  Patterns及Tuples的生成
    7.2.2  Patterns及Tuples的评估
    7.2.3  Snowball的实现细节
  7.3  关系抽取工具——DeepDive
    7.3.1  DeepDive概述
    7.3.2  DeepDive工作流程
    7.3.3  概率推断与因子图
  本章小结  
  思考题  
第四部分  自然语言处理高级任务
第8章  知识图谱
  8.1  知识图谱基本概念
    8.1.1  从语义网络到知识图谱
    8.1.2  知识的结构化、存储及查询
    8.1.3  几个开源的知识图谱
  8.2  知识图谱的关键构建技术
    8.2.1  本体匹配
    8.2.2  实体链接
    8.2.3  知识推理
  8.3  知识图谱应用
    8.3.1  反欺诈
    8.3.2  个性化推荐
    8.3.3  知识库问答
  本章小结  
  思考题  
第9章  文本分类
  9.1  文本分类的常见方法
    9.1.1  机器学习
    9.1.2  模型融合
    9.1.3  深度学习
  9.2  文本分类的不同应用场景
    9.2.1  二分类
    9.2.2  多分类
    9.2.3  多标签多分类
  9.3  案例:搭建一款新闻主题分类器
    9.3.1  数据预处理
    9.3.2  训练与预测
    9.3.3  改进
  本章小结  
  思考题  
第10章  文本摘要
  10.1  抽取式摘要
    10.1.1  传统方法
    10.1.2  基于深度学习的方法
    10.1.3  抽取式摘要的训练数据问题
  10.2  生成式摘要
    10.2.1  基础模型
    10.2.2  前沿模型中的技巧
    10.2.3  强化学习与生成式摘要
  10.3  案例:搭建网球新闻摘要生成器
    10.3.1  基于词频统计的摘要生成器
    10.3.2  基于图模型的摘要生成器
    10.3.3  结果分析
  本章小结  
  思考题  
第11章  机器翻译
  11.1  传统机器翻译
    11.1.1  源起
    11.1.2  基于规则
    11.1.3  基于大规模语料
  11.2  统计机器翻译
    11.2.1  相关流派
    11.2.2  基于信源信道的统计机器翻译
    11.2.3  案例:外星语的翻译实战
  11.3  神经机器翻译
    11.3.1  基本原理
    11.3.2  改进机制
    11.3.3  前沿与挑战
  本章小结  
  思考题  
第12章  聊天系统
  12.1  聊天系统的类型
    12.1.1  闲聊式机器人
    12.1.2  知识问答型机器人
    12.1.3  任务型聊天机器人
  12.2  聊天系统的关键技术
    12.2.1  检索技术
    12.2.2  意图识别和词槽填充
    12.2.3  对话管理
    12.2.4  强化学习与多轮对话
  12.3  案例:闲聊机器人实战
    12.3.1  技术概要
    12.3.2  基本配置及数据预处理
    12.3.3  闲聊机器人模型的搭建
    12.3.4  模型训练、预测以及优化
  本章小结  
  思考题  
第五部分  自然语言处理求职
第13章  自然语言处理技术的现在、未来及择业
  13.1  自然语言处理组织及人才需求介绍
    13.1.1  学术界
    13.1.2  工业界
    13.1.3  人才需求现状
  13.2  未来与自然语言处理
    13.2.1  自然语言处理热点技术方向
    13.2.2  自然语言处理的应用畅想
    13.2.3  自然语言处理带来的行业冲击
  13.3  面试题
    13.3.1  数据结构与算法
    13.3.2  数学基础
    13.3.3  机器学习与深度学习
    13.3.4  自然语言处理专业
    13.3.5  实际问题解决及技术领域见解
  本章小结  
  思考题  
附录A  思考题 参考答案
附录B  面试题答案目录