全部商品分类

您现在的位置: 全部商品分类 > 电子电脑 > 计算机技术 > 程序与语言

Python数据分析与可视化(第2版微课视频版)/大数据与人工智能技术丛书

  • 定价: ¥59.8
  • ISBN:9787302577584
  • 开 本:16开 平装
  •  
  • 折扣:
  • 出版社:清华大学
  • 页数:277页
  • 作者:编者:魏伟一//李...
  • 立即节省:
  • 2021-07-01 第2版
  • 2021-07-01 第1次印刷
我要买:
点击放图片

导语

  

内容提要

  

    本书从Python数据分析的基础知识入手,结合大量的数据分析示例,系统地介绍数据分析与可视化方法,带领读者逐步掌握Python数据分析的相关知识,提高解决实际问题的能力。
    本书共13章,主要内容包括数据分析与可视化概述、Python编程基础、NumPy数值计算基础、Pandas统计分析基础、Pandas数据载入与预处理、Matplotlib数据可视化基础、Seaborn可视化、pyecharts可视化、时间序列数据分析、SciPy科学计算、统计与机器学习、图像数据分析和综合案例实战等。
    本书可作为高等院校数据科学与大数据、软件工程和计算机科学与技术等专业的教材,也可作为Python数据分析初学者和爱好者的参考书。

目录

第1章  数据分析与可视化概述
  1.1  数据分析
  1.2  数据可视化
  1.3  数据分析与可视化常用工具
  1.4  为何选用Python进行数据分析与可视化
  1.5  Python数据分析与可视化常用类库
  1.6  Jupyter Notebook的安装和使用
    1.6.1  Jupyter Notebook的安装
    1.6.2  Jupyter Notebook的使用
  1.7  本章小结
  1.8  本章习题
第2章  Python编程基础
  2.1  Python语言基本语法
    2.1.1  基础数据类型
    2.1.2  变量和赋值
    2.1.3  运算符和表达式
    2.1.4  字符串
    2.1.5  流程控制
  2.2  内置数据类型
    2.2.1  列表
    2.2.2  元组
    2.2.3  字典
    2.2.4  集合
  2.3  函数
    2.3.1  函数的定义
    2.3.2  lambda函数
  2.4  文件操作
    2.4.1  文件处理过程
    2.4.2  数据的读取方法
    2.4.3  读取CSV文件
    2.4.4  文件写入与关闭
  2.5  本章小结
  2.6  本章习题
  2.7  本章实训
第3章  NumPy数值计算基础
  3.1  NumPy多维数组
    3.1.1  创建数组对象
    3.1.2  ndarray对象属性和数据转换
    3.1.3  生成随机数
    3.1.4  数组变换
  3.2  数组的索引和切片
    3.2.1  一维数组的索引
    3.2.2  多维数组的索引
  3.3  数组的运算
    3.3.1  数组和标量间的运算
    3.3.2  ufunc函数
    3.3.3  条件逻辑运算
  3.4  数组读/写
    3.4.1  读/写二进制文件
    3.4.2  读/写文本文件
    3.4.3  读取CSV文件
  3.5  NumPy中的数据统计与分析
    3.5.1  排序
    3.5.2  重复数据与去重
    3.5.3  常用统计函数
  3.6  本章小结
  3.7  本章习题
  3.8  本章实训
第4章  Pandas统计分析基础
  4.1  Pandas中的数据结构
    4.1.1  Series
    4.1.2  DataFrame
    4.1.3  索引对象
    4.1.4  查看DataFrame的常用属性
  4.2  Pandas索引操作
    4.2.1  重建索引
    4.2.2  更换索引
  4.3  DataFrame数据的查询与编辑
    4.3.1  DataFrame数据的查询
    4.3.2  DataFrame数据的编辑
  4.4  Pandas数据运算
    4.4.1  算术运算
    4.4.2  函数应用和映射
    4.4.3  排序
    4.4.4  汇总与统计
  4.5  数据分组与聚合
    4.5.1  数据分组
    4.5.2  数据聚合
    4.5.3  分组运算
  4.6  数据透视表
    4.6.1  透视表
    4.6.2  交叉表
  4.7  Pandas可视化
    4.7.1  线形图
    4.7.2  柱状图
    4.7.3  直方图和密度图
    4.7.4  散点图
  4.8  本章小结
  4.9  本章习题
  4.10  本章实训
第5章  Pandas数据载入与预处理
  5.1  数据载入
    5.1.1  读/写文本文件
    5.1.2  读/写Excel文件
    5.1.3  JSON数据的读取与存储
    5.1.4  读取数据库文件
  5.2  合并数据
    5.2.1  merge数据合并
    5.2.2  concat数据连接
    5.2.3  combine_first合并数据
  5.3  数据清洗
    5.3.1  检测与处理缺失值
    5.3.2  检测与处理重复值
    5.3.3  检测与处理异常值
    5.3.4  数据转换
  5.4  数据标准化
    5.4.1  离差标准化数据
    5.4.2  标准差标准化数据
  5.5  数据变换与数据离散化
    5.5.1  类别型数据的哑变量处理
    5.5.2  连续型变量的离散化
  5.6  本章小结
  5.7  本章习题
  5.8  本章实训
第6章  Matplotlib数据可视化基础
  6.1  Matplotlib简介
  6.2  Matplotlib绘图基础
    6.2.1  创建画布与子图
    6.2.2  添加画布内容
    6.2.3  绘图的保存与显示
  6.3  设置Pyplot的动态rc参数
    6.3.1  全局参数定制
    6.3.2  rc参数设置
    6.3.3  绘图的填充
    6.3.4  在绘图中显示公式
    6.3.5  文本注解
  6.4  Pyplot中的常用绘图
    6.4.1  折线图
    6.4.2  散点图
    6.4.3  直方图
    6.4.4  饼图
    6.4.5  箱线图
    6.4.6  概率图
    6.4.7  雷达图
    6.4.8  流向图
    6.4.9  绘图中的表格设置
    6.4.10  极坐标图
  6.5  词云
    6.5.1  安装相关的包
    6.5.2  词云生成过程
    6.5.3  词云生成示例
  6.6  本章小结
  6.7  本章习题
  6.8  本章实训
第7章  Seaborn可视化
  7.1  Seaborn简介
  7.2  风格设置
    7.2.1  Seaborn绘图设置
    7.2.2  Seaborn主题设置
    7.2.3  设置绘图元素比例
  7.3  Seaborn中的常用绘图
    7.3.1  直方图和密度曲线图
    7.3.2  散点图
    7.3.3  箱线图
    7.3.4  散点图矩阵
    7.3.5  小提琴图
    7.3.6  柱状图
    7.3.7  多变量图
    7.3.8  回归图
    7.3.9  关系类图
    7.3.10  热力图
  7.4  本章小结
  7.5  本章习题
  7.6  本章实训
第8章  pyecharts可视化
  8.1  pyecharts简介
  8.2  pyecharts的使用方法
  8.3  pyecharts常用图表
    8.3.1  柱状图
    8.3.2  饼图
    8.3.3  漏斗图
    8.3.4  散点图
    8.3.5  K线图
    8.3.6  仪表盘
    8.3.7  词云
    8.3.8  组合图表
    8.3.9  桑基图
    8.3.10  平行坐标图
    8.3.11  图
    8.3.12  地图
  8.4  本章小结
  8.5  本章习题
  8.6  本章实训
第9章  时间序列数据分析
  9.1  日期和时间数据类型
    9.1.1  datetime构造
    9.1.2  数据转换
  9.2  时间序列基础
    9.2.1  时间序列构造
    9.2.2  索引与切片
  9.3  日期范围、频率和移位
    9.3.1  日期范围
    9.3.2  频率和移位
  9.4  时期
    9.4.1  时期基础
    9.4.2  频率转换
    9.4.3  时期数据转换
  9.5  重采样、降采样和升采样
    9.5.1  重采样
    9.5.2  降采样
    9.5.3  升采样
  9.6  时间序列的平稳性检验
    9.6.1  时序图检验
    9.6.2  自相关图检验
    9.6.3  构造统计量检验
  9.7  本章小结
  9.8  本章习题
  9.9  本章实训
第10章  SciPy科学计算
  10.1  SciPy中的常数与特殊函数
    10.1.1  SciPy的constants模块
    10.1.2  SciPy的special模块
  10.2  SciPy中的线性代数基本运算
    10.2.1  基本的矩阵运算
    10.2.2  线性方程组求解
    10.2.3  行列式的计算
    10.2.4  范数
    10.2.5  特征值分解
    10.2.6  奇异值分解
  10.3  SciPy中的优化
    10.3.1  方程求解及求极值
    10.3.2  数据拟合
  10.4  SciPy中的稀疏矩阵处理
    10.4.1  稀疏矩阵的存储
    10.4.2  稀疏矩阵的运算
  10.5  SciPy中的图像处理
    10.5.1  图像平滑
    10.5.2  图像旋转和锐化
  10.6  信号处理
    10.6.1  数据重采样
    10.6.2  信号的卷积
    10.6.3  信号的时频分析
  10.7  本章小结
  10.8  本章习题
  10.9  本章实训
第11章  统计与机器学习
  11.1  Scikit-learn的主要功能
  11.2  回归分析
    11.2.1  一元线性回归方法
    11.2.2  逻辑回归
  11.3  分类
    11.3.1  决策树规约
    11.3.2  KNN算法
    11.3.3  支持向量机
    11.3.4  朴素贝叶斯分类
  11.4  聚类
    11.4.1  K-Means聚类
    11.4.2  层次聚类
    11.4.3  基于密度的聚类
  11.5  主成分分析
  11.6  本章小结
  11.7  本章习题
  11.8  本章实训
第12章  图像数据分析
  12.1  OpenCV简介与导入
    12.1.1  OpenCV简介
    12.1.2  Python中OpenCV的安装与导入
  12.2  cv2图像处理基础
    12.2.1  cv2的基本方法与属性
    12.2.2  cv2图像处理示例
  12.3  应用尺度不变特征变换
  12.4  使用加速鲁棒特征检测
  12.5  图像降噪
  12.6  本章小结
  12.7  本章习题
  12.8  本章实训
第13章  综合案例
  13.1  职业人群体检数据分析
  13.2  股票数据分析
  13.3  红酒数据分析