全部商品分类

您现在的位置: 全部商品分类 > 社科总论 > 社科总论 > 统计学

SPSS Modeler数据挖掘方法及应用(第3版)/数据科学与大数据技术系列

  • 定价: ¥69
  • ISBN:9787121363191
  • 开 本:16开 平装
  •  
  • 折扣:
  • 出版社:电子工业
  • 页数:348页
  • 作者:编者:薛薇|责编:...
  • 立即节省:
  • 2020-03-01 第3版
  • 2020-03-01 第1次印刷
我要买:
点击放图片

导语

  

内容提要

  

    数据挖掘是大数据分析中最活跃的地带。SPSS Modeler充分利用计算机系统的运算处理能力和图形展现能力,将数据挖掘方法、应用与工具有机地融为一体,成为内容全面、功能强大、操作友好的数据挖掘软件产品,是大数据分析的理想工具。
    本书以数据挖掘的实践过程为主线,系统介绍了决策树、人工神经网络、支持向量机、Logistic回归、判别分析、贝叶斯网络、聚类分析等一系列经典数据挖掘方法,以及数据整理和降维处理等必备知识,同时给出了SPSS Modeler实现的全过程。讲解方法从易到难,说明问题由浅入深,软件操作详细全面。
    本书力求以最通俗的方式阐述数据挖掘方法的核心思想与基本原理,同时配合SPSS Modeler 18(中文版)软件操作说明,希望读者能够直观理解方法的本质,快速掌握软件使用技巧,并应用到数据挖掘实践中。本书提供实例数据和电子课件,读者可登录华信教育资源网www.hxedu.com.cn免费下载使用。
    本书可作为高等院校管理类、财经类、计算机类专业本科生和研究生的数据挖掘教材,也可作为商业管理、金融保险、社会教育等行业进行数据挖掘实践的参考用书。

作者简介

    薛薇,博士,中国人民大学应用统计研究中心专职研究员,中国人民大学统计学院副教授。主要开设课程:机器学习,计量经济学,统计软件,统计学。研究方向:机器学习与深度学习算法研究。基于顾客消费行为大数据的客户终身价值统计建模,以及营销与品牌大数据的机器学习算法应用。

目录

第1章  数据挖掘和SPSS Modeler使用概述
  1.1  数据挖掘的产生背景
    1.1.1  海量大数据的分析需求催生数据挖掘
    1.1.2  应用对理论的挑战催生数据挖掘
  1.2  什么是数据挖掘
    1.2.1  数据挖掘和数据库中的知识发现
    1.2.2  数据挖掘方法论
    1.2.3  数据挖掘的任务和应用
    1.2.4  数据挖掘得到的知识形式
    1.2.5  数据挖掘算法的分类
  1.3  SPSS Modeler软件概述
    1.3.1  SPSS Modeler的数据流
    1.3.2  SPSS Modeler的窗口
    1.3.3  数据流的基本管理
    1.3.4  缓存节点和超节点
    1.3.5  从一个示例看SPSS Modeler的使用
第2章  SPSS Modeler的数据读入和数据集成
  2.1  变量类型
    2.1.1  从数据挖掘角度看变量类型
    2.1.2  从计算机存储角度看变量类型
  2.2  读入数据
    2.2.1  读自由格式的文本文件
    2.2.2  读Excel电子表格数据
    2.2.3  读SPSS格式文件
  2.3  数据集成
    2.3.1  数据的纵向合并
    2.3.2  数据的横向合并
    2.3.3  数据源替换
第3章  SPSS Modeler的数据理解
  3.1  变量说明
    3.1.1  变量的重新实例化
    3.1.2  有效变量值和无效值调整
    3.1.3  变量角色的说明
  3.2  数据质量的评估和调整
    3.2.1  数据的基本特征与质量评价报告
    3.2.2  变量值的调整
    3.2.3  数据质量管理
  3.3  数据的排序
    3.3.1  单变量排序
    3.3.2  多重排序
  3.4  数据的分类汇总
    3.4.1  单变量分类汇总
    3.4.2  多重分类汇总
第4章  SPSS Modeler的数据准备
  4.1  变量变换
    4.1.1  CLEM表达式
    4.1.2  变量值的重新计算
    4.1.3  变量类别值的调整
  4.2  变量派生
    4.2.1  生成新变量
    4.2.2  生成服从正态分布的新变量
    4.2.3  派生哑变量
  4.3  数据精简
    4.3.1  随机抽样
    4.3.2  根据条件选取样本
  4.4  建模中的数据集处理策略
    4.4.1  样本的平衡处理
    4.4.2  样本子集的划分
第5章  SPSS Modeler的基本分析
  5.1  数值型变量的基本分析
    5.1.1  计算基本描述统计量
    5.1.2  绘制散点图
    5.1.3  绘制线图
  5.2  两分类型变量相关性的研究
    5.2.1  两分类型变量相关性的图形分析
    5.2.2  两分类型变量相关性的数值分析
  5.3  两总体的均值比较
    5.3.1  两总体均值比较的图形分析
    5.3.2  独立样本的均值检验
    5.3.3  配对样本的均值检验
  5.4  RFM分析
    5.4.1  什么是RFM分析
    5.4.2  RFM汇总
    5.4.3  计算RFM得分
第6章  SPSS Modeler的数据精简
  6.1  变量值的离散化处理
    6.1.1  无监督的数据分组
    6.1.2  有监督的数据分组
    6.1.3  变量值离散化处理的应用示例
  6.2  特征选择
    6.2.1  特征选择的一般方法
    6.2.2  特征选择的应用示例
  6.3  因子分析
    6.3.1  什么是因子分析
    6.3.2  因子提取和因子载荷矩阵的求解
    6.3.3  因子的命名解释
    6.3.4  计算因子得分
    6.3.5  因子分析的应用示例
第7章  分类预测:SPSS Modeler的决策树
  7.1  决策树算法概述
    7.1.1  什么是决策树
    7.1.2  决策树的几何理解
    7.1.3  决策树的核心问题
  7.2  SPSS Modeler的C5.0算法及其应用
    7.2.1  信息熵和信息增益
      7.2.2  C5.0  决策树的生长算法
      7.2.3  C5.0  决策树的剪枝算法
      7.2.4  C5.0  决策树的基本应用示例
      7.2.5  C5.0  的推理规则集
    7.2.6  损失矩阵
    7.2.7  N折交叉验证和Boosting技术
  7.3  SPSS Modeler的分类回归树及其应用
    7.3.1  分类回归树的生长过程
    7.3.2  分类回归树的剪枝过程
    7.3.3  损失矩阵对分类回归树的影响
    7.3.4  分类回归树的基本应用示例
    7.3.5  分类回归树的交互建模
    7.3.6  交互建模中分类回归树的评价
  7.4  SPSS Modeler的CHAID算法及其应用
    7.4.1  CHAID算法
    7.4.2  穷举CHAID算法
    7.4.3  CHAID算法的剪枝
    7.4.4  CHAID算法的应用示例
  7.5  SPSS Modeler的QUEST算法及其应用
    7.5.1  QUEST算法
    7.5.2  QUEST算法的应用示例
  7.6  模型的对比分析
    7.6.1  不同模型的误差对比
    7.6.2  不同模型的收益对比
第8章  分类预测:SPSS Modeler的人工神经网络
  8.1  人工神经网络算法概述
    8.1.1  人工神经网络的概念和种类
    8.1.2  人工神经网络中的节点和意义
    8.1.3  人工神经网络建立的一般步骤
  8.2  SPSS Modeler的B-P反向传播网络
    8.2.1  感知机模型
    8.2.2  B-P反向传播网络的特点
    8.2.3  B-P反向传播算法
    8.2.4  B-P反向传播网络的其他问题
  8.3  SPSS Modeler的B-P反向传播网络的应用
    8.3.1  基本操作
    8.3.2  结果说明
  8.4  SPSS Modeler的径向基函数网络及其应用
    8.4.1  径向基函数网络中的隐节点和输出节点
    8.4.2  径向基函数网络的学习过程
    8.4.3  径向基函数网络的应用示例
第9章  分类预测:SPSS Modeler的支持向量机
  9.1  支持向量分类的基本思路
    9.1.1  支持向量分类的数据和目标
    9.1.2  支持向量分类的三种情况
  9.2  线性可分问题下的支持向量分类
    9.2.1  如何求解超平面
    9.2.2  如何利用超平面进行分类预测
  9.3  广义线性可分下的支持向量分类
    9.3.1  如何求解超平面
    9.3.2  可调参数的意义:把握程度和精度的权衡
  9.4  线性不可分下的支持向量分类
    9.4.1  线性不可分的一般解决途径和维灾难问题
    9.4.2  支持向量分类克服维灾难的途径
  9.5  支持向量回归
    9.5.1  支持向量回归与一般线性回归:目标和策略
    9.5.2  支持向量回归的基本思路
  9.6  支持向量机的应用
    9.6.1  基本操作
    9.6.2  结果解读
第10章  分类预测:SPSS Modeler的Logistic回归分析
  10.1  Logistic回归分析概述
  10.2  二项Logistic回归分析
    10.2.1  二项Logistic回归方程
    10.2.2  二项Logistic回归方程系数的含义
    10.2.3  二项Logistic回归方程的检验
    10.2.4  二项Logistic回归分析中的虚拟自变量
  10.3  二项Logistic回归分析的应用
    10.3.1  基本操作
    10.3.2  结果解读
  10.4  多项Logistic回归分析及其应用
    10.4.1  多项Logistic回归分析概述
    10.4.2  多项Logistic回归分析的应用示例
第11章  分类预测:SPSS Modeler的判别分析
  11.1  距离判别
    11.1.1  距离判别的基本思路
    11.1.2  判别函数的计算
  11.2  Fisher判别
    11.2.1  Fisher判别的基本思路
    11.2.2  Fisher判别的计算
  11.3  贝叶斯判别
    11.3.1  贝叶斯判别的基本思路
    11.3.2  贝叶斯判别的计算
  11.4  判别分析的应用
    11.4.1  基本操作
    11.4.2  判别分析的准备工作
    11.4.3  结果解读
第12章  分类预测:SPSS Modeler的贝叶斯网络
  12.1  贝叶斯方法基础
    12.1.1  贝叶斯概率和贝叶斯公式
    12.1.2  朴素贝叶斯分类法
  12.2  贝叶斯网络概述
    12.2.1  什么是贝叶斯网络
    12.2.2  贝叶斯网络的组成及构建
    12.2.3  贝叶斯网络的分类预测
  12.3  TAN贝叶斯网络
    12.3.1  TAN贝叶斯网络的结构
    12.3.2  TAN贝叶斯网络结构的学习
    12.3.3  TAN贝叶斯网络的参数估计
  12.4  马尔科夫毯网络
    12.4.1  马尔科夫毯网络的基本概念
    12.4.2  条件独立检验
    12.4.3  马尔科夫毯网络结构的学习
    12.4.4  马尔科夫毯网络的分类预测
  12.5  贝叶斯网络的应用
    12.5.1  基本操作
    12.5.2  结果解读
第13章  探索内部结构:SPSS Modeler的关联分析
  13.1  简单关联规则及其有效性
    13.1.1  简单关联规则的基本概念
    13.1.2  简单关联规则的有效性和实用性
  13.2  SPSS Modeler的Apriori算法及其应用
    13.2.1  产生频繁项集
    13.2.2  依据频繁项集产生简单关联规则
    13.2.3  Apriori算法的应用示例
  13.3  SPSS Modeler的序列关联及其应用
    13.3.1  序列关联中的基本概念
    13.3.2  Sequence算法
    13.3.3  序列关联的时间约束
    13.3.4  Sequence算法的应用示例
第14章  探索内部结构:SPSS Modeler的聚类分析
  14.1  聚类分析的一般问题
    14.1.1  聚类分析的提出
    14.1.2  聚类算法
  14.2  SPSS Modeler的K-Means聚类及应用
    14.2.1  K-Means对“亲疏程度”的测度
    14.2.2  K-Means聚类过程
    14.2.3  K-Means聚类的应用示例
  14.3  SPSS Modeler的两步聚类及其应用
    14.3.1  两步聚类对“亲疏程度”的测度
    14.3.2  两步聚类过程
    14.3.3  聚类数目的确定
    14.3.4  两步聚类的应用示例
  14.4  SPSS Modeler的Kohonen网络聚类及其应用
    14.4.1  Kohonen网络聚类机理
    14.4.2  Kohonen网络聚类过程
    14.4.3  Kohonen网络聚类的应用示例
  14.5  基于聚类分析的离群点探索
    14.5.1  多维空间基于聚类的离群点诊断方法
    14.5.2  多维空间基于聚类的离群点诊断应用示例