导语

内容提要

在信息爆炸的时代,数据可视化作为有效理解和利用数据的方式,能将复杂数据转化为直观图形,以洞察数据规律和趋势。本书是一份实用的数据可视化分析与实战指南,分为三大部分。第一部分讲解理论基础,从数据可视化基本概念出发,介绍图表类型、设计原则及相关工具,接着阐述数据采集方法、预处理环节(清洗、集成、规约与转换),还介绍多种数据分析方法,帮助读者建立扎实的理论基础。第二部分聚焦DataEase工具,对从安装部署、数据源管理,到图表制作、仪表板设计等环节的操作要点进行详尽阐述,助力读者掌握该工具。第三部分通过销售驾驶舱分析、《全唐诗》可视化分析、全球商业开源洞察分析3个实际案例,介绍数据可视化在不同场景中的应用,提升读者实战能力。
本书适合对数据可视化感兴趣,希望系统学习其基础理论,掌握DataEase工具使用方法,并通过实际案例提升实战能力的初学者以及有一定基础的读者阅读。
目录
第一部分 理论基础
第1章 数据可视化概述
1.1 数据可视化的基础知识
1.1.1 数据与数据可视化
1.1.2 数据可视化的过程
1.2 数据可视化图表
1.2.1 常用的数据可视化图表
1.2.2 数据可视化设计原则
1.3 数据可视化工具
1.3.1 Excel
1.3.2 ECharts
1.3.3 AntV
1.3.4 Tableau
1.3.5 DataEase
第2章 数据采集
2.1 数据采集概述
2.1.1 数据的来源
2.1.2 数据采集的方法
2.1.3 数据源和数据集
2.2 常用数据集的获取
2.2.1 常用数据集
2.2.2 数据集获取方法
第3章 数据预处理
3.1 数据预处理概述
3.1.1 “混乱”的数据
3.1.2 数据预处理的主要环节
3.2 数据清洗
3.2.1 一致性检查
3.2.2 缺失值处理
3.2.3 噪声数据
3.3 数据集成
3.3.1 属性匹配
3.3.2 属性冗余
3.4 数据规约与数据转换
3.4.1 数据规约
3.4.2 数据转换
第4章 数据分析
4.1 数据分析基础
4.1.1 数据类型
4.1.2 数据思维
4.1.3 数据分析方法论
4.2 数据分析方法
4.2.1 描述性分析法
4.2.2 对比分析法
4.2.3 结构分析法
4.2.4 漏斗分析法
4.2.5 相关性分析法
4.2.6 预测分析法
第二部分 DataEase实操
第5章 初识DataEase
5.1 DataEase简介
5.1.1 产品介绍
5.1.2 系统架构
5.2 安装部署
5.2.1 桌面端部署
5.2.2 Linux服务器端部署
5.2.3 Windows服务器端部署
5.2.4 离线升级
5.2.5 命令行工具
第6章 数据源
6.1 数据源介绍
6.2 本地文件(Excel)数据源
6.2.1 新建数据源
6.2.2 替换数据
6.2.3 追加数据
6.3 MySQL数据源
6.3.1 新建数据源
6.3.2 编辑数据源
6.4 API数据源
第7章 数据集
7.1 单表数据集
7.2 自定义SQL数据集
7.3 多表关联数据集
7.4 数据集管理
7.4.1 基础管理
7.4.2 新建计算字段
7.5 定时同步
7.5.1 数据连接管理
7.5.2 任务管理
第8章 DataEase图表制作
8.1 图表制作通用步骤
8.2 指标类图表
8.2.1 指标卡
8.2.2 仪表盘
8.3 表格
8.3.1 汇总表
8.3.2 透视表
8.4 线/面图
8.4.1 基础折线图
8.4.2 面积图
8.5 柱形图
8.5.1 基础柱状图
8.5.2 堆叠柱状图
8.6 分布图
8.6.1 饼图
8.6.2 词云图
8.7 关系图
8.7.1 散点图
8.7.2 漏斗图
第9章 仪表板设计
9.1 仪表板配置
9.1.1 复用
9.1.2 批量编辑
9.1.3 移动端仪表板
9.1.4 仪表板样式
9.2 仪表板交互
9.2.1 钻取
9.2.2 联动
9.2.3 跳转
9.2.4 过滤组件
9.2.5 SQL动态参数
9.2.6 外部参数设置
9.3 仪表板设计技巧
9.3.1 排版布局
9.3.2 配色技巧
9.4 数据大屏介绍
第三部分 数据可视化分析实战
第10章 销售驾驶舱分析案例
10.1 背景介绍和需求分析
10.1.1 背景介绍
10.1.2 需求分析
10.2 数据准备
10.2.1 数据介绍
10.2.2 连接数据源
10.2.3 新建数据集
10.2.4 在数据集中新建计算字段
10.3 数据分析和可视化
10.3.1 商品销量分析
10.3.2 年度最强销售门店分析
10.3.3 各类门店占比及毛利润占比分析
10.3.4 年度销售额和毛利润趋势分析
10.3.5 销售额、利润和门店数统计
10.3.6 仪表板设置
第11章 《全唐诗》可视化分析案例
11.1 背景介绍和提出问题
11.2 数据准备
11.2.1 数据介绍
11.2.2 添加数据源和数据集
11.3 数据分析及可视化
11.3.1 谁的诗收录得最多
11.3.2 描写最多的季节是哪个
11.3.3 出现频率较高的汉字有哪些
11.3.4 出现较多的地名有哪些
11.3.5 查询组件
11.3.6 仪表板设置
第12章 全球商业开源洞察分析案例
12.1 背景介绍和需求分析
12.1.1 开源软件与商业开源
12.1.2 需求分析
12.2 数据准备
12.2.1 数据介绍
12.2.2 添加数据源和数据集
12.3 数据分析及可视化
12.3.1 总投资额和总投资笔数
12.3.2 投资金额变化趋势
12.3.3 各阶段的投资额占比和投资笔数占比
12.3.4 总投资额Top10和总投资笔数Top10的公司
12.3.5 仪表板设置