全部商品分类

您现在的位置: 全部商品分类 > 电子电脑 > 电工无线电自动化 > 自动化技术

数据挖掘(高等学校大数据技术与应用规划教材)

  • 定价: ¥38
  • ISBN:9787113251673
  • 开 本:16开 平装
  •  
  • 折扣:
  • 出版社:中国铁道
  • 页数:180页
  • 作者:编者:宋万清//杨...
  • 立即节省:
  • 2019-01-01 第1版
  • 2019-01-01 第1次印刷
我要买:
点击放图片

导语

  

内容提要

  

    宋万清、杨寿渊、陈剑雪、高永彬编著的《数据挖掘(高等学校大数据技术与应用规划教材)》着力于介绍数据挖掘基础知识、基本原理、常用算法,主要内容包括数据挖掘概述、数据的描述与可视化、数据的采集和预处理、数据的归约、关联规则挖掘、分类与预测、非线性预测模型、聚类分析、深度学习简介、使用Weka进行数据挖掘。本书通俗易懂,注重基础知识、基本原理和基本方法,注重启发和引申,以培养学生独立思考和独立发现的能力。
    本书适合作为数据科学与大数据、信息管理、统计等专业的本科层次基础课教材,也可作为相关专业研究生层次的参考用书。

目录

第1章  数据挖掘概述
  1.1  什么是数据挖掘
    1.1.1  数据、信息和知识
    1.1.2  数据挖掘的定义
    1.1.3  数据挖掘的发展简史
  1.2  数据挖掘的基本流程及方法概述
    1.2.1  数据挖掘的基本流程
    1.2.2  数据挖掘的任务和方法概述
  1.3  数据挖掘的应用
    1.3.1  数据挖掘在商务领域的应用
    1.3.2  数据挖掘在医疗和医学领域的应用
    1.3.3  数据挖掘在银行和保险领域的应用
    1.3.4  数据挖掘在社交媒体领域的应用
  习题
第2章  数据的描述与可视化
  2.1  概述
  2.2  数据对象与属性类型
    2.2.1  什么是属性
    2.2.2  标称属性
    2.2.3  二元属性
    2.2.4  序数属性
    2.2.5  数值属性
    2.2.6  离散属性与连续属性
  2.3  数据的基本统计描述
    2.3.1  中心趋势度量
    2.3.2  度量数据散布:极差、四分位数、方差、标准差和四分位数极差
    2.3.3  数据基本统计的图形描述
  2.4  数据可视化
    2.4.1  基于像素的可视化
    2.4.2  几何投影可视化
    2.4.3  基于图符的可视化
    2.4.4  层次可视化
    2.4.5  可视化复杂对象和关系
  2.5  数据相似性和相异性度量
    2.5.1  数据矩阵与相异性矩阵
    2.5.2  标称属性的邻近性度量
    2.5.3  二元属性的邻近性度量
    2.5.4  数值属性的相异性闵可夫斯基距离
    2.5.5  序数属性的邻近性度量
    2.5.6  混合类型属性的相异性
    2.5.7  余弦相似性
  习题
第3章  数据的采集和预处理
  3.1  概述
    3.1.1  大数据采集的特点
    3.1.2  大数据采集的方法
  3.2  数据预处理的目的和任务
  3.3  数据清洗
    3.3.1  缺失值清洗
    3.3.2  异常值清洗
    3.3.3  格式内容清洗
    3.3.4  逻辑错误清洗
    3.3.5  非需求数据清洗
    3.3.6  关联性验证
  3.4  数据集成
  3.5  数据变换
  习题
第4章  数据的归约
  4.1  概述
  4.2  属性的选择与数值归约
    4.2.1  属性的评估准则
    4.2.2  属性子集选择方法
    4.2.3  数值归约
  4.3  线性回归
  4.4  主成分分析
  习题
第5章  关联规则挖掘
  5.1  概述
  5.2  关联规则的分类
  5.3  关联规则的研究步骤
    5.3.1  关联规则挖掘算法的分类
    5.3.2  各种算法类型的对比
  5.4  Apriori算法分析
  5.5  实例分析
  5.6  关联规则的推广(GRI)
  5.7  关联规则的深入挖掘
  习题
第6章  分类与预测
  6.1  概述
    6.1.1  基本概念
    6.1.2  数据分类的一般方法
  6.2  决策树模型
    6.2.1  决策树的工作原理
    6.2.2  决策树的适用问题
    6.2.3  ID3算法
    6.2.4  决策树的结点划分
  6.3  贝叶斯分类模型
    6.3.1  贝叶斯定理
    6.3.2  贝叶斯模型的特点
  6.4  线性判别模型
  6.5  逻辑回归模型
    6.5.1  逻辑回归模型概述
    6.5.2  逻辑回归模型的基本概念
  6.6  模型的评估与选择
    6.6.1  评估分类器性能的度量
    6.6.2  保持方法和随机二次抽样
    6.6.3  交叉验证
    6.6.4  自助法
    6.6.5  使用统计显著性检验选择模型
  习题
第7章  非线性预测模型
  7.1  概述
  7.2  支持向量机
    7.2.1  支持向量机分类原理
    7.2.2  非线性支持向量机
    7.2.3  支持向量机回归预测
    7.2.4  基于支持向量机的预测分析
  7.3  神经网络
    7.3.1  人工神经网络模型与分类
    7.3.2  BP神经网络
    7.3.3  RBF神经网络
    7.3.4  基于神经网络的预测分析
  习题
第8章  聚类分析
  8.1  概述
  8.2  k-均值聚类
  8.3  k-中心聚类
  8.4  聚类评估
    8.4.1  外部法
    8.4.2  内部法
    8.4.3  可视化方法
  习题
第9章  深度学习简介
  9.1  概述
  9.2  来自人类视觉机理的启发
  9.3  深层神经网络
  9.4  卷积神经网络
    9.4.1  卷积和池化
    9.4.2  CNN网络框架
    9.4.3  CNN的应用
  9.5  RNN循环神经网络
    9.5.1  RNN的结构
    9.5.2  RNN的缺陷
    9.5.3  RNN的应用
  9.6  生成对抗网络
    9.6.1  GAN的原理与架构
    9.6.2  GAN的应用
  习题
第10章  使用Weka进行数据挖掘
  10.1  概述
  10.2  Weka关联数据挖掘的基本操作
  10.3  数据格式
  10.4  关联规则挖掘
  10.5  分类与回归
  10.6  聚类分析
  习题
附录 A 拉格朗日优化法
参考文献