全部商品分类

您现在的位置: 全部商品分类 > 经 济 > 工商管理 > 企业经济

企业数据湖/大数据技术丛书

  • 定价: ¥99
  • ISBN:9787111615538
  • 开 本:16开 平装
  •  
  • 折扣:
  • 出版社:机械工业
  • 页数:369页
  • 作者:(印度)汤姆斯·约...
  • 立即节省:
  • 2019-01-01 第1版
  • 2019-01-01 第1次印刷
我要买:
点击放图片

导语

  

内容提要

  

    “数据湖”已经成为大数据行业的一个重要术语,它是数据科学家们获得有意义的洞察力的平台,这些洞察力可以被企业用来重新定义或改变它们的运营方式。Lambda架构作为大数据领域的杰出模式之一也应运而生。
    汤姆斯·约翰,潘卡·米斯拉著的《企业数据湖》旨在帮助你选择正确的大数据技术并使用Lambda架构模式来为企业构建自己的数据湖。全书主要分为三部分,第一部分介绍数据湖的概念、数据湖在企业中的重要性以及Lambda架构。第二部分深入研究使用Lambda架构构建数据湖所需的主要技术组件,介绍流行的大数据技术,如Apache Hadoop、Sqoop、Flume、Flink和Elasticsearch等。第三部分展示一些非常实用的数据湖落地建议,包括企业应如何建立一个真实的数据湖,以及提高数据湖运营效率所需的其他技术组件。第三部分最后还详细介绍了几个实际的用例,以及在企业内实现这些用例时应考虑的重要方面。

目录

译者序
推荐序
关于作者
关于技术审核人员
前言
第一部分  概述
第1章  数据导论
  1.1  探索数据
  1.2  什么是企业数据
  1.3  企业数据管理
  1.4  大数据相关概念
  1.5  数据与企业的相关性
  1.6  数据质量
  1.7  企业中数据如何存放
    1.7.1  内联网(企业内部)
    1.7.2  互联网(企业外部)
    1.7.3  数据持久化存储(RDBMS或者NoSQL)
    1.7.4  传统的数据仓库
    1.7.5  文件存储
  1.8  企业现状
  1.9  企业数字化转型
  1.10  数据湖用例启示
  1.11  总结
第2章  数据湖概念概览
  2.1  什么是数据湖
  2.2  数据湖如何帮助企业
  2.3  数据湖是如何工作的
  2.4  数据湖与数据仓库的区别
  2.5  数据湖的构建方法
  2.6  Lambda架构驱动的数据湖
    2.6.1  数据摄取层——摄取数据用于处理和存储
    2.6.2  批处理层——批量处理已提取数据
    2.6.3  快速处理层——近实时数据处理
    2.6.4  数据存储层——存储所有数据
    2.6.5  服务层——数据交付与导出
    2.6.6  数据获取层——从源系统获取数据
……
第二部分  数据湖的技术组件
第三部分  将所有技术整合在一起