全部商品分类

您现在的位置: 全部商品分类 > 电子电脑 > 电工无线电自动化 > 自动化技术

Hadoop大数据技术原理与应用/大数据技术与应用丛书

  • 定价: ¥39
  • ISBN:9787302524403
  • 开 本:16开 平装
  •  
  • 折扣:
  • 出版社:清华大学
  • 页数:290页
  • 作者:编者:黑马程序员
  • 立即节省:
  • 2019-05-01 第1版
  • 2019-05-01 第1次印刷
我要买:
点击放图片

导语

  

内容提要

  

    本书围绕Hadoop生态圈相关系统介绍大数据处理架构。全书共11章,其中,第1、2章主要带领大家认识Hadoop以及学会搭建Hadoop集群;第3~5章讲解分布式文件系统(HDFS)、分布式计算框架MapReduce以及分布式协调服务;第6章讲解Hadoop 2.0新特性,包含YARN和高可用特性;第7~10章主要讲解Hadoop生态圈的相关辅助系统,包括Hive、Flume、Azkaban和Sqoop;第11章是一个综合项目——网站流量日志数据分析系统,目的是教会大家如何利用Hadoop生态圈技术构建大数据系统架构并进行开发,同时加深对Hadoop技术的理解。
    本书附有配套视频、源代码、习题、教学设计、教学课件等资源。同时,为了帮助初学者更好地学习本书中的内容,还提供了在线答疑,欢迎读者关注。
    本书可作为高等院校本、专科计算机相关专业,信息管理等相关专业的大数据课程教材,也可供相关技术人员参考,是一本适合广大计算机编程爱好者的优秀读物。

目录

第1章  初识Had00p
  1.1  大数据概述
    1.1.1  什么是大数据
    1.1.2  大数据的特征
    1.1.3  研究大数据的意义
  1.2  大数据的应用场景
    1.2.1  医疗行业的应用
    1.2.2  金融行业的应用
    1.2.3  零售行业的应用
  1.3  HadOOp概述
    1.3.1  Hadoop的前世今生
    1.3.2  Hadoop的优势
    1.3.3  HadOOp的生态体系
    1.3.4  Hadoop的版本
  1.4  本章小结
  1.5  课后习题
第2章  搭建Hadoop集群
  2.1  安装准备
    2.1.1  虚拟机安装
    2.1.2  虚拟机克隆
    2.1.3  Linux系统网络配置
    2.1.4  SSH服务配置
  2.2  HadOOp集群搭建
    2.2.1  HadoOp集群部署模式
    2.2.2  JDK安装
    2.2.3  Hadoop安装
    2.2.4  Hadoop集群配置
  2.3  Hadoop集群测试
    2.3.1  格式化文件系统
    2.3.2  启动和关闭Hadoop集群
    2.3.3  通过UI查看Hadoop运行状态
  2.4  Hadoop集群初体验
  2.5  本章小结
  2.6  课后习题
第3章  HDFS分布式文件系统
  3.1  HDFS的简介
    3.1.1  HDFS的演变
    3.1.2  HDFS的基本概念
    3.1.3  HDFS的特点
  3.2  HDFS的架构和原理
    3.2.1  HDFS存储架构
    3.2.2  HDFS文件读写原理
  3.3  HDFS的Shell操作
    3.3.1  HDFS Shell介绍
    3.3.2  案例——Shell定时采集数据到HDFS
  3.4  HDFS的Java API操作
    3.4.1  HDFS Java API介绍
    3.4.2  案例——使用Java API操作HDFS
  3.5  本章小结
  3.6  课后习题
第4章  MapReduce分布式计算框架
  4.1  MapReduce概述
    4.1.1  MapReduce核心思想
    4.1.2  MapRedLlee编程模型
    4.1.3  MapRedLice编程实例——词频统计
  4.2  MapReduce工作原理
    4.2.1  MapReduce工作过程
    4.2.2  MapTask工作原理
    4.2.3  RedLiceTask工作原理
    4.2.4  shuffle工作原理
  4.3  MapReduce编程组件
    4.3.1  InputFormat组件
    4.3.2  Mapper组件
    4.3.3  Reducer组件
    4.3.4  Partitioner组件
    4.3.5  Combiner组件
  ……
第5章  Zookeeper分布式协调服务
第6章  Hadoop 2.0新特性
第7章  Hive数据仓库
第8章  Flume日志采集系统
第9章  工作流管理器(Azkaban)
第10章  Sqoop数据迁移
第11章  综合项目——网站流量日志数据分析系统