导语
内容提要
“大数据导论”是一门理论性和实践性都很强的课程。本教材针对信息管理、经济管理和其他相关专业学生的发展需求,系统、全面地介绍了关于大数据技术与应用的基本知识和技能,详细介绍了大数据与大数据时代、大数据的可视化、大数据的商业规则、大数据时代的思维变革、大数据促进医疗与健康、大数据激发创造力、大数据预测分析、大数据促进学习、大数据在云端、支撑大数据的技术、数据科学与数据科学家和大数据的未来等内容,具有较强的系统性、可读性和实用性。
本书是为高等院校相关专业“大数据基础”“大数据导论”等课程全新设计编写,具有丰富实践特色的主教材,也可供有一定实践经验的软件开发人员、管理人员参考和作为继续教育的教材。
目录
第一章 大数据概论
第一节 大数据技术
第二节 大数据时代
第三节 大数据处理的基本流程
第四节 大数据开发涉及的关键技术
第二章 大数据采集技术概述
第一节 大数据分类
第二节 大数据采集方法分类
第三节 通过系统日志采集大数据
第四节 通过网络爬虫采集大数据
第五节 Scrapy网络爬虫简介
第三章 大数据预处理架构和方法简介
第一节 大数据预处理整体架构
第二节 大数据预处理方法
第三节 大数据预处理之数据清洗
第四节 大数据预处理之数据集成
第五节 大数据预处理之数据转换
第六节 大数据预处理之数据消减
第七节 离散化和数值概念层次树简介
第四章 大数据处理技术
第一节 分布式计算
第二节 服务器集群
第三节 大数据的技术基础
第四节 GFS、MapReduce和BigTable:Google的三种大数据处理系统
第五章 Hadoop大数据处理框架简介
第一节 Hadoop系统简介
第二节 Hadoop HDFS分布式文件
第三节 HDFS两种操作方式:命令行和JavaAPI
第六章 NoSQL非关系型数据库简介
第一节 NoSQL概述
第二节 NoSQL数据库类型简介
第七章 Hadoop HBase数据库简介
第一节 HBase列式数据模型简介
第二节 HBaseShell常用命令和基本操作
第三节 HBase的物理存储和逻辑架构
第四节 HBase常用JavaAPI
第五节 HBase JavaAPI编程实例
第八章 Hadoop MapReduce简介
第一节 批处理模式
第二节 MapReduce基本思想
第三节 Hadoop MapReduce架构
第四节 Hadoop MapReduce工作流程
第五节 MapReduce实例分析:单词计数
第六节 MapReduce执行流程和Shuffle过程
第七节 MapReduce编程实例:单词计数
第九章 Spark简介
第一节 Spark与Hadoop
第二节 Spark RDD
第三节 Spark总体架构和运行流程
第四节 Spark生态圈简介
第五节 Spark开发实例
第六节 Spark Streaming简介
第七节 Spark Streaming编程实战(开发实例)
第十章 数据挖掘
第一节 数据挖掘概述
第二节 Spark MLlib简介
第三节 数据挖掘之分类和预测简介
第四节 决策树和朴素贝叶斯算法简介
第五节 朴素贝叶斯算法
第六节 回归分析预测技术简介
第七节 聚类分析
第八节 k-means聚类算法简介
第九节 DBSCAN聚类算法简介
第十节 数据挖掘之关联规则分析简介
第十一节 Apriori算法和FP-Tree算法简介
第十一章 基于大数据的精准营销
第一节 精准营销概述
第二节 大数据精准营销过程
第三节 大数据精准营销方式
第十二章 基于大数据的个性化推荐系统
第一节 推荐系统概述
第二节 推荐机制
第三节 推荐系统的应用
第十三章 大数据预测
第一节 预测是大数据的核心价值
第二节 大数据预测的思维改变
第三节 大数据预测的典型应用领域
第十四章 大数据在金融行业的应用
第一节 大数据可以应用的行业
第二节 银行大数据应用场景
第三节 证券行业数据应用场景
第四节 保险行业数据应用场景
第十五章 大数据在互联网行业的应用
第一节 精准营销
第二节 个性化服务
第三节 商品个性化推荐
第十六章 大数据在物流行业的应用
第一节 物流大数据的作用
第二节 物流大数据应用案例
第三节 Amazon物流大数据应用
第四节 国际物流大数据应用
第五节 大数据的其他应用领域
第十七章 大数据治理
第一节 大数据治理的策略
第二节 元数据与主数据管理
第三节 数据质量管理
第四节 数据标准管理
第五节 数据资产管理
第六节 大数据治理发展之路
第七节 大数据治理的五个核心要素
第八节 自服务大数据治理是解决问题之道
第九节 大数据治理技术需要不断革新
第十节 如何选择合适的大数据治理工具
第十一节 大数据治理在人工智能的作用
第十二节 区块链和AI如何帮助主数据管理