全部商品分类

您现在的位置: 全部商品分类 > 电子电脑 > 计算机技术 > 信息处理与专用数据库

智能搜索(大数据搜索引擎原理及算法解析)/人工智能与大数据系列

  • 定价: ¥69.8
  • ISBN:9787302535508
  • 开 本:16开 平装
  •  
  • 折扣:
  • 出版社:清华大学
  • 页数:198页
  • 作者:编者:沙芸
  • 立即节省:
  • 2019-11-01 第1版
  • 2019-11-01 第1次印刷
我要买:
点击放图片

导语

  

内容提要

  

    本书介绍大数据分布式搜索引擎开发原理与技术实现,主要内容包括多种语言的文本处理、分布式算法与代码实现、Elasticsearch的使用与原理等,通过一个医药领域垂直搜索引擎和电商搜索来说明如何开发实际的大数据智能搜索引擎。全书共分6章,第1章着重介绍开发智能搜索引擎可以采用的软硬件环境;第2~5章着重讨论构建分布式智能搜索引擎可能需要的多种语言文本处理方法,例如Kaldi语音识别实现和基于Raft共识协议的分布式计算平台实现;第6章介绍医药和电商搜索两个应用案例。
    本书适合作为高等院校计算机、软件工程专业本科生、研究生的参考用书,对于对人工智能领域感兴趣的人士也有一定的参考价值。

目录

第1章  智能搜索引擎开发
  1.1  人工智能与智能搜索引擎
  1.2  Linux操作系统基础
    1.2.1  SSH远程登录
    1.2.2  Micro文本编辑器
    1.2.3  Linux Shell脚本基础
    1.2.4  Shell脚本
    1.2.5  AWK
  1.3  Java基础
    1.3.1  使用Ant
    1.3.2  使用Maven
    1.3.3  使用Gradle
    1.3.4  使用Groovy Shell
    1.3.5  使用JShell
  1.4  Python基础
    1.4.1  Windows下安装Python
    1.4.2  Linux下安装Python
    1.4.3  开发环境
  1.5  C#基础
  1.6  硬件基础
  1.7  本章小结
第2章  搜索引擎理解语义
  2.1  处理文本
  2.2  基于文法的语言模型
  2.3  正则表达式查找文本
  2.4  中文词语切分与词性标注
    2.4.1  使用中文分词
    2.4.2  正向最大长度匹配法
    2.4.3  未登录串识别
    2.4.4  基本的N元模型
  2.5  隐马尔可夫模型
    2.5.1  数据基础
    2.5.2  维特比算法
  2.6  英文文本切分与标注
    2.6.1  句子切分
    2.6.2  标注词性
  2.7  命名实体识别
    2.7.1  人名识别
    2.7.2  人名识别规则
  2.8  文本归一化
  2.9  依存树模型
  2.10  情感分析
  2.11  本章小结
第3章  搜索引擎听懂语音
  3.1  语音识别总体结构
  3.2  Kaldi快速入门
    3.2.1  安装Kaldi
    3.2.2  yesno例子
    3.2.3  数据准备
    3.2.4  词典准备
    3.2.5  构建一个简单的ASR
  3.3  使用FFmpeg提取音频
  3.4  时间序列
  3.5  动态时间规整
  3.6  傅里叶变换
    3.6.1  离散傅里叶变换
    3.6.2  快速傅里叶变换
  3.7  MFCC特征
  3.8  在线解码
    3.8.1  使用现成的模型
    3.8.2  使用Alex-ASR
  3.9  加权有限状态转换
    3.9.1  FSA
    3.9.2  FST
    3.9.3  WFST
  3.10  语音识别语料库
    3.10.1  TIMIT语音库
    3.10.2  中文语音库
  3.11  本章小结
第4章  Elasticsearch分布式搜索引擎
  4.1  搭建Elasticsearch集群
  4.2  索引数据
  4.3  实现搜索接口
  4.4  搜索界面开发
    4.4.1  使用Spring Boot开发搜索界面
    4.4.2  使用.NET开发搜索界面
  4.5  检索模型
    4.5.1  使用BM25检索模型
    4.5.2  参数调优
  4.6  搜索中文优化
  4.7  Elasticsearch源代码分析
    4.7.1  导入源代码到Eclipse
    4.7.2  Guice框架
    4.7.3  Netty异步IO框架
    4.7.4  分布式设计与实现
    4.7.5  使用Lucene
  4.8  本章小结
第5章  分布式计算平台
  5.1  Atomix框架
    5.1.1  Raft协议
    5.1.2  使用Atomix
  5.2  gRPC框架
  5.3  本章小结
第6章  智能搜索案例分析
  6.1  医药垂直搜索引擎
    6.1.1  网络爬虫
    6.1.2  抓取PubMed
    6.1.3  MVC搜索界面开发
    6.1.4  构建知识库
    6.1.5  自动问答
  6.2  电商搜索
    6.2.1  电商爬虫
    6.2.2  商品搜索
    6.2.3  在线客服
  6.3  本章小结
参考文献