全部商品分类

您现在的位置: 全部商品分类 > 电子电脑 > 电工无线电自动化 > 自动化技术

Hadoop大数据分析与挖掘实战/大数据技术丛书

  • 定价: ¥69
  • ISBN:9787111522652
  • 开 本:16开 平装
  •  
  • 折扣:
  • 出版社:机械工业
  • 页数:290页
  • 作者:张良均//樊哲//赵...
  • 立即节省:
  • 2016-01-01 第1版
  • 2016-01-01 第1次印刷
我要买:
点击放图片

导语

  

    大数据分析与挖掘已经成为大数据时代最重要的技能之一,社会对这方面的人才的需求随着数据的增长而不断增长。目前,数据分析与挖掘方面的技术和工具已经很多,而且在不断成熟,基于Hadoop架构的大数据挖掘技术在这方面具有非常明显的优势,应用范围也越来越广,但是这方面的系统性学习资料却十分稀缺。
    为了满足目前的大数据分析人才需求,张良均、樊哲、赵云龙、李成华、刘丽君等《Hadoop大数据分析与挖掘实战》编著的以大家熟知的Hadoop技术来展开,理论部分介绍了HadooD生态系统基本原理及常用大数据挖掘建模工具。案例部分以解决某个应用的挖掘目标为前提,先介绍案例背景提出挖掘目标,再阐述分析方法与过程,最后完成模型构建,在介绍建模过程中穿插操作训练,把相关的知识点嵌入相应的操作过程中,使读者轻松理解并掌握相关的理论和知识点。

内容提要

  

    10多位技术专家结合自己lO多年的经验,以电信、航空、医疗等多个行业的实战案例为主线,深入浅出地讲解了如何基于Hado叩架构技术进行大数据挖掘建模、数据分析和二次开发。
    张良均、樊哲、赵云龙、李成华、刘丽君等《Hadoop大数据分析与挖掘实战》编著共16章,分三个部分:基础篇、实战篇、高级篇。
    基础篇(第l~6章),第1章的主要内容是数据挖掘概述、大数据餐饮行业应用;第2章针对大数据理论知识进行基础讲解,简明扼要地对Hadoop安装、原理等做了介绍;第3章介绍了大数据仓库Hive的安装、原理等内容;第4章介绍了大数据数据库HBase的安装、原理等内容;第5章介绍了几种大数据挖掘建模平台,同时重点介绍了本书使用的开源TipDM—HB大数据挖掘平台;第6章对数据挖掘的建模过程,各种挖掘建模的常用算法与原理及其在大数据挖掘算法库Mahout的实现原理进行了介绍。
    实战篇(第7~14章),重点对大数据挖掘技术在法律咨询、电子商务、航空、移动通信、互联网、生产制造以及公共服务等行业的应用进行了分析。在案例结构组织上,本书是按照先介绍案例背景与挖掘目标,再阐述大数据时代针对大数据的分析方法与过程,最后完成模型构建的顺序进行,对建模过程等关键环节进行了详细的分析。最后通过上机实践,加深对大数据挖掘技术以及分析流程的认识。
    高级篇(第15~16章),介绍了基于Hadoop大数据开发的相关技术以及开发步骤,同时使用实例来展示这些步骤,使读者可以自己动手实践,亲自体会开发的乐趣;同时,还介绍了基于TipDM—HB大数据挖掘平台的二次开发实例,借助TipDM—HB大数据挖掘平台二次开发工具,可以更加怏捷、高效地完成相关大数据应用的二次开发,降低开发难度,使读者更方便地体会到大数据分析与挖掘的强大魅力。
    图书配套提供原始样本数据文件、相关代码及教学用PPT等。

目录

前言
基础篇
第1章  数据挖掘基础
  1.1  某知名连锁餐饮企业的困惑
  1.2  从餐饮服务到数据挖掘
  1.3  数据挖掘的基本任务
  1.4  数据挖掘建模过程
    1.4.1  定义挖掘目标
    1.4.2  数据取样
    1.4.3  数据探索
    1.4.4  数据预处理
    1.4.5  挖掘建模
    1.4.6  模型评价
  1.5  餐饮服务中的大数据应用
  1.6  小结
第2章  Hadoop基础
  2.1  概述
    2.1.1  Hadoop简介
    2.1.2  Hadoop生态系统
  2.2  安装与配置
  2.3  Hadoop原理
    2.3.1  Hadoop  HDFS原理
    2.3.2  Hadoop  MapReduce原理
    2.3.3  Hadoop  YARN原理
  2.4  动手实践
  2.5  小结
第3章  Hadoop生态系统:
  3.1  概述
    3.1.1  Hive简介
    3.1.2  Hive安装与配置
  3.2  Hive原理
    3.2.1  Hive架构
    3.2.2  Hive的数据模型
  3.3  动手实践
  3.4  小结
第4章  Hadoop生态系统:
  4.1  概述
    4.1.1  HBase简介
    4.1.2  HBase安装与配置
  4.2  HBase原理
    4.2.1  HBase架构
    4.2.2  HBase与
    4.2.3  HBase访问接口
    4.2.4  HBase数据模型
  4.3  动手实践
  4.4  小结
第5章  大数据挖掘建模平台
  5.1  常用的大数据平台
  5.2  TipDM-HB大数据挖掘建模平台
    5.2.1  TipDM-HB大数据挖掘建模平台的功能
    5.2.2  TipDM-HB大数据挖掘建模平台操作流程及实例
    5.2.3  TipDM-HB大数据挖掘建模平台的特点
  5.3  小结
第6章  挖掘建模
  6.1  分类与预测
    6.1.1  实现过程
    6.1.2  常用的分类与预测算法
    6.1.3  决策树
    6.1.4  Mahout中Random  Forests算法的实现原理
    6.1.5  动手实践
  6.2  聚类分析
    6.2.1  常用聚类分析算法
    6.2.2  K-Means聚类算法
    6.2.3  Mahout中K-Means算法的实现原理
    6.2.4  动手实践
  6.3  关联规则
    6.3.1  常用的关联规则算法
    6.3.2  FP-Growth关联规则算法
    6.3.3  Mahout中Parallel  FrequentPattern  Mining算法的实现原理
    6.3.4  动手实践
  6.4  协同过滤
    6.4.1  常用的协同过滤算法
    6.4.2  基于项目的协同过滤算法简介
    6.4.3  Mahout中ItembasedCollaborative  Filtering算法的实现原理
    6.4.4  动手实践
  6.5  小结
实战篇
第7章  法律咨询数据分析与服务推荐
  7.1  背景与挖掘目标
  7.2  分析方法与过程
    7.2.1  数据抽取
    7.2.2  数据探索分析
    7.2.3  数据预处理
    7.2.4  模型构建
  7.3  上机实验
  7.4  拓展思考
  7.5  小结
第8章  电商产品评论数据情感分析
  8.1  背景与挖掘目标
  8.2  分析方法与过程
    8.2.1  评论数据采集
    8.2.2  评论预处理
    8.2.3  文本评论分词
    8.2.4  构建模型
  8.3  上机实验
  8.4  拓展思考
  8.5  小结
第9章  航空公司客户价值分析
  9.1  背景与挖掘目标
  9.2  分析方法与过程
    9.2.1  数据抽取
    9.2.2  数据探索分析
    9.2.3  数据预处理
    9.2.4  模型构建
  9.3  上机实验
  9.4  拓展思考
  9.5  小结
第10章  基站定位数据商圈分析
  10.1  背景与挖掘目标
  10.2  分析方法与过程
    10.2.1  数据抽取
    10.2.2  数据探索分析
    10.2.3  数据预处理
    10.2.4  构建模型
  10.3  上机实验
  10.4  拓展思考
  10.5  小结
第11章  互联网电影智能推荐
  11.1  背景与挖掘目标
  11.2  分析方法与过程
    11.2.1  数据抽取
    11.2.2  构建模型
  11.3  上机实验
  11.4  拓展思考
  11.5  小结
第12章  家电故障备件储备预测分析
  12.1  背景与挖掘目标
  12.2  分析方法与过程
    12.2.1  数据探索分析
    12.2.2  数据预处理
    12.2.3  构建模型
  12.3  上机实验
  12.4  拓展思考
  12.5  小结
第13章  市供水混凝投药量控制分析
  13.1  背景与挖掘目标
  13.2  分析方法与过程
    13.2.1  数据抽取
    13.2.2  数据探索分析
    13.2.3  数据预处理
    13.2.4  构建模型
  13.3  上机实验
  13.4  拓展思考
  13.5  小结
第14章  基于图像处理的车辆压双黄线检测
  14.1  背景与挖掘目标
  14.2  分析方法与过程
    14.2.1  数据抽取
    14.2.2  数据探索分析
    14.2.3  数据预处理
    14.2.4  构建模型
  14.3  上机实验
  14.4  拓展思考
  14.5  小结
高级篇
第15章  基于Mahout的大数据挖掘开发
  15.1  概述
  15.2  环境配置
  15.3  基于Mahout算法接口的二次开发
    15.3.1  Mahout算法实例
    15.3.2  Mahout算法接口的二次开发示例
  15.4  小结
第16章  基于TipDM-HB的数据挖掘二次开发
  16.1  概述
    16.1.1  TipDM-HB大数据挖掘建模平台服务接口
    16.1.2  Apache  CXF简介
  16.2  TipDM-HB大数据挖掘建模平台服务开发实例
    16.2.1  环境配置
    16.2.2  开发实例
  16.3  小结
参考资料