全部商品分类

您现在的位置: 全部商品分类 > 电子电脑 > 计算机技术 > 程序与语言

使用C#开发搜索引擎(第2版)

  • 定价: ¥68
  • ISBN:9787302484462
  • 开 本:16开 平装
  •  
  • 折扣:
  • 出版社:清华大学
  • 页数:454页
  • 作者:编者:罗刚
  • 立即节省:
  • 2018-01-01 第2版
  • 2018-01-01 第1次印刷
我要买:
点击放图片

导语

  

内容提要

  

    罗刚编著的《使用C#开发搜索引擎(第2版)》介绍如何以C#作为工具开发智能搜索引擎系统。
    本书是一本介绍业界热门的Lucene.Net、使用WebBrowser做爬虫以及结合Solr/ElasticSearch开发ASP.NET搜索的书籍。书中从网络爬虫抓取数据开始;然后介绍中文分词、文本排重等文本挖掘技术和搜索结果展现;最后介绍在线智能客服(聊天机器人)开发框架。从C#语法开始,逐渐深入,是零基础实践面向未来的智能软件开发的首选。
    对于学习复杂数据结构和自然语言处理相关应用开发也有参考价值。

目录

第1章  使用C#开发搜索引擎快速入门
  1.1  各种搜索引擎
    1.1.1  通用搜索
    1.1.2  垂直搜索
    1.1.3  站内搜索
  1.2  搜索引擎的整体结构
  1.3  搜索引擎的基本技术
    1.3.1  网络爬虫
    1.3.2  文本挖掘
    1.3.3  全文索引
    1.3.4  搜索语法介绍
    1.3.5  搜索用户界面
  1.4  C#开发快速入门
    1.4.1  准备开发环境
    1.4.2  基本语法
    1.4.3  多维数组
    1.4.4  位运算
    1.4.5  枚举类型
    1.4.6  面向对象
    1.4.7  字符串
    1.4.8  读写文件
    1.4.9  集合类
    1.4.10  泛型
    1.4.11  委托和事件
    1.4.12  lambda表达式
    1.4.13  单元测试
    1.4.14  扩展方法
    1.4.15  类库
  1.5  算法基础
    1.5.1  双端队列
    1.5.2  散列表
    1.5.3  单链表
    1.5.4  标准Trie树
    1.5.5  二叉搜索树
    1.5.6  三叉Trie树
    1.5.7  平衡Trie树
  1.6  本章小结
  1.7  术语表
第2章  使用C#开发网络爬虫
  2.1  网络爬虫抓取原理
  2.2  爬虫架构
    2.2.1  基本架构
    2.2.2  分布式爬虫架构
    2.2.3  垂直爬虫架构
  2.3  下载网页
    2.3.1  HTTP协议
    2.3.2  下载静态网页
    2.3.3  下载动态网页
  2.4  线程池
  2.5  网络爬虫的遍历与实现
  2.6  网站地图
  2.7  连接池
  2.8  URL地址查新
    2.8.1  嵌入式数据库
    2.8.2  布隆过滤器
  2.9  抓取
  2.10  解析相对地址
  2.11  网页更新
  2.12  信息过滤
  2.13  垂直行业抓取
  2.14  抓取限制应对方法
    2.14.1  更换IP地址
    2.14.2  抓取需要登录的网页
    2.14.3  抓取ASP.net网页
  2.15  保存信息
    ……
第3章  索引各种格式文档
第4章  自然语言处理
第5章  用C#实现中文分词
第6章  Lucene.net原理与应用
第7章  实现搜索用户界面
第8章  使用Solr开发网站搜索
第9章  Elasticsearch开发分布式搜索
第10章  在线客服案例分析
参考资源