全部商品分类

您现在的位置: 全部商品分类 > 电子电脑 > 电工无线电自动化 > 自动化技术

数据分析与数据挖掘(中文版计算机科学与技术学科研究生系列教材)/计算机科学与技术学科前沿丛书

  • 定价: ¥39.5
  • ISBN:9787302493662
  • 开 本:16开 平装
  •  
  • 折扣:
  • 出版社:清华大学
  • 页数:276页
  • 作者:编者:喻梅//于健
  • 立即节省:
  • 2018-04-01 第1版
  • 2018-04-01 第1次印刷
我要买:
点击放图片

导语

  

内容提要

  

    喻梅、于健主编的《数据分析与数据挖掘(中文版计算机科学与技术学科研究生系列教材)》主要介绍数据分析与数据挖掘的基本概念和方法,包括数据的基本属性和概念、数据预处理技术、数据仓库和OLAP技术、回归分析、频繁模式挖掘、分类、聚类、离群点分析。对书中每一部分先介绍基本概念和理论基础,然后给出应用实例,便于读者更好地理解和应用算法,最后给出习题。
    本书适用于数据分析与数据挖掘领域的初学者,可以作为相关专业本科及研究生教材。书中算法由浅入深、由原理到应用,有利于初学者的学习和理解。本书也可以作为数据分析与数据挖掘相关专业人士的读物

目录

第1章  概述
  1.1 数据分析与数据挖掘
    1.1.1 数据分析
    1.1.2 数据挖掘
    1.1.3 区别和联系
  1.2 分析与挖掘的数据类型
  1.3 数据分析与数据挖掘的方法
  1.4 数据分析与数据挖掘使用的技术
  1.5 应用场景及存在的问题
    1.5.1 数据分析与数据挖掘的应用
    1.5.2 存在的主要问题
  1.6 本书结构概述
  1.7 习题
第2章  数据
  2.1 数据对象与属性类别
    2.1.1 属性的定义
    2.1.2 属性的分类
  2.2 数据基本统计描述
    2.2.1 中心趋势度量
    2.2.2 数据散布度量
    2.2.3 数据的图形显示
  2.3 数据的相似性和相异性度量
    2.3.1 数据矩阵与相异性矩阵
    2.3.2 标称属性的邻近性度量
    2.3.3 二元属性的邻近性度量
    2.3.4 数值属性的相异性
    2.3.5 序数属性的邻近性度量
    2.3.6 余弦相似性
  2.4 习题
第3章  数据预处理
  3.1 数据预处理及任务
    3.1.1 数据预处理的必要性
    3.1.2 数据预处理的主要任务
  3.2 数据清理
    3.2.1 缺失值、噪声和不一致数据的处理
    3.2.2 数据清理方式
  3.3 数据集成
  3.4 数据归约
    3.4.1 直方图
    3.4.2 数据立方体聚集
    3.4.3 属性子集选择
    3.4.4 抽样
  3.5 数据变换与数据离散化
    3.5.1 数据变换策略及分类
    3.5.2 数据泛化
    3.5.3 数据规范化
    3.5.4 数据离散化
  3.6 习题
第4章  数据仓库与
  4.1 数据仓库的基本概念
    4.1.1 数据仓库的定义
    4.1.2 数据仓库的性质
    4.1.3 数据仓库体系结构
    4.1.4 数据仓库设计模型
  4.2 数据仓库设计
    4.2.1 数据仓库的概念模型设计
    4.2.2 数据仓库的逻辑模型设计
    4.2.3 数据仓库的物理模型设计
  4.3 数据仓库实现
  4.4 联机分析处理
    4.4.1 OLAP简介
    4.4.2 OLAP与OLTP的关系
    4.4.3 典型的OLAP操作
  4.5 元数据模型
    4.5.1 元数据的类型
    4.5.2 元数据的作用
    4.5.3 元数据的使用
  4.6 习题
第5章  回归分析
  5.1 回归分析概述
    5.1.1 变量间的两类关系
    5.1.2 回归分析的步骤
  5.2 一元线性回归
    5.2.1 原理分析
    5.2.2 回归方程求解及模型检验
    5.2.3 一元线性回归实例
    5.2.4 案例分析:使用Weka实现一元线性回归
  5.3 多元线性回归
    5.3.1 原理分析
    5.3.2 回归方程求解及模型检验
    5.3.3 多元线性回归实例
    5.3.4 案例分析:使用Weka实现多元线性回归
  5.4 多项式回归
    5.4.1 原理分析
    5.4.2 多项式回归实例
    5.4.3 案例分析:使用Excel实现多项式回归
  5.5 习题
第6章  频繁模式挖掘
  6.1 概述
    6.1.1 案例分析
    6.1.2 相关概念
    6.1.3 先验性质
  6.2 关联模式评估
    6.2.1 支持度-置信度框架
    6.2.2 相关性分析
    6.2.3 模式评估度量
  6.3 Apriori算法
    6.3.1 Apriori算法分析
    6.3.2 案例分析:使用Weka实现Apriori算法
  6.4 FP-growth算法
    6.4.1 FP-growth算法分析
    6.4.2 案例分析:使用Weka实现FP-growth算法
  6.5 压缩频繁项集
    6.5.1 挖掘闭模式
    6.5.2 挖掘极大模式
  6.6 习题
第7章  分类
  7.1 分类概述
    7.1.1 分类的基本概念
    7.1.2 分类的相关知识
    7.1.3 分类的评价指标
  7.2 决策树
    7.2.1 决策树基本概念
    7.2.2 决策树分类器的算法过程
    7.2.3 ID3算法
    7.2.4 C4.5算法
    7.2.5 Weka中使用C4.5算法进行分类预测实例
    7.2.6 决策树的剪枝
    7.2.7 随机森林算法
    7.2.8 使用Weka的随机森林进行分类预测
  7.3 朴素贝叶斯分类
    7.3.1 朴素贝叶斯学习基本原理
    7.3.2 朴素贝叶斯分类过程
    7.3.3 使用Weka的朴素贝叶斯分类器进行分类实例
  7.4 惰性学习法
    7.4.1 K近邻算法描述
    7.4.2 K近邻算法性能
    7.4.3 使用Weka进行K近邻分类实例
  7.5 逻辑回归
    7.5.1 逻辑回归基本概念
    7.5.2 二项逻辑回归过程
    7.5.3 使用逻辑回归分类算法的实例
    7.5.4 使用Weka进行逻辑回归分类实例
  7.6 支持向量机
    7.6.1 线性可分支持向量机算法
    7.6.2 线性可分支持向量机算法过程
    7.6.3 使用Weka进行支持向量机分类实例
  7.7 神经网络
    7.7.1 神经网络基本概念
    7.7.2 BP神经网络算法过程
    7.7.3 BP神经网络分类算法的实例
    7.7.4 使用Weka进行神经网络的分类实例
  7.8 习题
第8章  聚类
  8.1 聚类概述
    8.1.1 聚类的基本概念
    8.1.2 聚类算法的分类
  8.2 基于划分的聚类
    8.2.1 K-均值算法
    8.2.2 K-中心点算法
    8.2.3 使用Weka进行基于划分的聚类实例
  8.3 基于层次的聚类
    8.3.1 基于层次的聚类的基本概念
    8.3.2 类间距离度量
    8.3.3 分裂层次聚类
    8.3.4 凝聚层次聚类
    8.3.5 BIRCH算法
    8.3.6 使用Weka进行基于层次的聚类实例
  8.4 基于密度的聚类
    8.4.1 基于密度的聚类的基本概念
    8.4.2 DBSCAN算法
    8.4.3 使用Weka进行基于密度的聚类实例
  8.5 基于网格的聚类
    8.5.1 基于网格的聚类的基本概念
    8.5.2 STING算法
    8.5.3 CLIQUE算法
  8.6 聚类质量的评估
  8.7 习题
第9章  离群点检测
  9.1 离群点的定义与类型
    9.1.1 离群点的定义
    9.1.2 离群点类型
  9.2 离群点的检测
    9.2.1 检测方法的分类
    9.2.2 统计学方法
    9.2.3 近邻性方法
    9.2.4 基于聚类的方法
    9.2.5 基于分类的方法
  9.3 习题
附录A Weka的安装及使用规范
  A.1 Weka的安装
    A.1.1 Weka
    A.1.2 JRE的安装
    A.1.3 Weka的安装
  A.2 Weka使用方法
  A.3 Weka数据格式
参考文献