全部商品分类

您现在的位置: 全部商品分类 > 电子电脑 > 计算机技术 > 程序与语言

深度学习搜索引擎开发(Java实现)/图灵程序设计丛书

  • 定价: ¥79
  • ISBN:9787115547262
  • 开 本:16开 平装
  •  
  • 折扣:
  • 出版社:人民邮电
  • 页数:259页
  • 作者:(意)托马索·泰奥...
  • 立即节省:
  • 2020-10-01 第1版
  • 2020-10-01 第1次印刷
我要买:
点击放图片

导语

  

内容提要

  

    本书是市面上少见的将搜索与深度学习相结合的书,讨论了使用(深度)神经网络来帮助建立有效的搜索引擎的方法。阅读本书无须具备开发搜索引擎的背景,也不需要具备有关机器学习或深度学习的预备知识,因为本书将介绍所有相关的基础知识和实用技巧。书中研究了搜索引擎的几个组成部分,不仅针对它们的工作方式提供了一些见解,还为在不同环境中使用神经网络提供了指导。读完本书,你将深入理解搜索引擎面临的主要挑战、这些挑战的常见解决方法以及深度学习所能提供的帮助。你将清晰地理解几种深度学习技术以及它们在搜索环境中的适用范围,并深入了解Lucene和Deeplearning4j库。书中示例代码用Java编写。
    本书适合有一定编程经验,对深度学习和开发搜索引擎感兴趣的读者阅读。

目录

第一部分  当搜索遇上深度学习
  第1章  神经搜索
    1.1  神经网络及深度学习
    1.2  什么是机器学习
    1.3  深度学习能为搜索做什么
    1.4  学习深度学习的路线图
    1.5  检索有用的信息
      1.5.1  文本、词素、词项和搜索基础
      1.5.2  相关性优先
      1.5.3  经典检索模型
      1.5.4  精确率与召回率
    1.6  未解决的问题
    1.7  打开搜索引擎的黑盒子
    1.8  利用深度学习解决问题
    1.9  索引与神经元
    1.10  神经网络训练
    1.11  神经搜索的前景
    1.12  总结
  第2章  生成同义词
    2.1  同义词扩展介绍
      2.1.1  为什么要使用同义词
      2.1.2  基于词汇表的同义词匹配
    2.2  语境的重要性
    2.3  前馈神经网络
      2.3.1  前馈神经网络如何工作:权重和激活函数
      2.3.2  简述反向传播
    2.4  使用word2vec
      2.4.1  在Deeplearning4j中设置word2vec
      2.4.2  基于word2vec的同义词扩展
    2.5  评价和比较
    2.6  用于生产系统时的考虑
    2.7  总结
第二部分  将神经网络用于搜索引擎
  第3章  从纯检索到文本生成
    3.1  信息需求与查询:弥补差距
      3.1.1  生成可选查询
      3.1.2  数据准备
      3.1.3  生成数据的小结
    3.2  学习序列
    3.3  循环神经网络
      3.3.1  循环神经网络内部结构和动态
      3.3.2  长期依赖
      3.3.3  LSTM网络
    3.4  用于无监督文本生成的LSTM网络
    3.5  从无监督文本生成到监督文本生成
    3.6  生产系统的考虑因素
    3.7  总结
  第4章  更灵敏的查询建议
    4.1  生成查询建议
      4.1.1  编写查询时的建议
      4.1.2  基于字典的建议算法
    4.2  Lucene Lookup API
    4.3  分析后的建议算法
    4.4  使用语言模型
    4.5  基于内容的建议算法
    4.6  神经语言模型
    4.7  基于字符的神经语言建议模型
    4.8  调优LSTM 语言模型
    4.9  使用词嵌入使建议多样化
    4.10  总结
  第5章  用词嵌入对搜索结果排序
    5.1  排序的重要性
    5.2  检索模型
      5.2.1  TF-IDF与向量空间模型
      5.2.2  在Lucene中对文档进行排序
      5.2.3  概率模型
    5.3  神经信息检索
    5.4  从单词到文档向量
    5.5  评价和比较
    5.6  总结
  第6章  用于排序和推荐的文档嵌入
    6.1  从词嵌入到文档嵌入
    6.2  在排序中使用段向量
    6.3  文档嵌入及相关内容
      6.3.1  搜索、推荐和相关内容
      6.3.2  使用高频词项查找相似内容
      6.3.3  使用段向量检索相似内容
      6.3.4  从编码器-解码器模型用向量检索相似内容
    6.4  总结
第三部分  延伸
  第7章  跨语言搜索
    7.1  为讲多种语言的用户提供服务
      7.1.1  翻译文档与查询
      7.1.2  跨语言搜索
      7.1.3  在Lucene上进行多语言查询
    7.2  统计机器翻译
      7.2.1  对齐
      7.2.2  基于短语的翻译
    7.3  使用并行语料库
    7.4  神经机器翻译
      7.4.1  编码器-解码器模型
      7.4.2  DL4J中用于机器翻译的编码器-解码器
    7.5  多语言的单词和文档嵌入
    7.6  总结
  第8章  基于内容的图像搜索
    8.1  图像内容和搜索
    8.2  回顾:基于文本的图像检索
    8.3  理解图像
      8.3.1  图像表示
      8.3.2  特征提取
    8.4  图像表示的深度学习
      8.4.1  卷积神经网络
      8.4.2  图像搜索
      8.4.3  局部敏感散列
    8.5  处理未标记的图像
    8.6  总结
  第9章  性能一瞥
    9.1  深度学习的性能与约定
    9.2  索引和神经元协同工作
    9.3  使用数据流
    9.4  总结
  展望未来