全部商品分类

您现在的位置: 全部商品分类 > 电子电脑 > 计算机技术 > 程序与语言

R数据科学(全彩印刷)/图灵程序设计丛书

  • 定价: ¥139
  • ISBN:9787115486394
  • 开 本:16开 平装
  •  
  • 折扣:
  • 出版社:人民邮电
  • 页数:341页
  • 作者:(新西兰)哈德利·...
  • 立即节省:
  • 2018-08-01 第1版
  • 2018-08-01 第1次印刷
我要买:
点击放图片

导语

  

内容提要

  

    哈德利·威克姆、加勒特·格罗勒芒德著的《R数据科学(全彩印刷)/图灵程序设计丛书》的目标是教会读者使用重要的数据科学工具,从而为实施数据科学奠定坚实的基础。读完本书后,你将掌握R语言的精华,并能够熟练使用多种工具来解决各种数据科学难题。每一章都按照这样的顺序组织内容:先给出一些引人入胜的示例,以便你可以整体了解这一章的内容,然后再深入细节。本书的每一节都配有习题,以帮助你实践所学到的知识。
    本书适合R数据科学家阅读。

目录

前言
第一部分  探索
  第1章  使用ggplot2进行数据可视化
    1.1  简介
    1.2  第一步
      1.2.1  mpg数据框
      1.2.2  创建ggplot图形
      1.2.3  绘图模板
      1.2.4  练习
    1.3  图形属性映射
    1.4  常见问题
    1.5  分面
    1.6  几何对象
    1.7  统计变换
    1.8  位置调整
    1.9  坐标系
    1.10  图形分层语法
  第2章  工作流:基础
    2.1  代码基础
    2.2  对象名称
    2.3  函数调用
  第3章  使用dplyr进行数据转换
    3.1  简介
      3.1.1  准备工作
      3.1.2  nycflig
      3.1.3  dplyr基础
    3.2  使用filter()筛选行
      3.2.1  比较运算符
      3.2.2  逻辑运算符
      3.2.3  缺失值
      3.2.4  练习
    3.3  使用arrange()排列行
    3.4  使用select()选择列
    3.5  使用mutate()添加新变量
      3.5.1  常用创建函数
      3.5.2  练习
    3.6  使用summarize()进行分组摘要
      3.6.1  使用管道组合多种操作
      3.6.2  缺失值
      3.6.3  计数
      3.6.4  常用的摘要函数
      3.6.5  按多个变量分组
      3.6.6  取消分组
      3.6.7  练习
    3.7  分组新变量(和筛选器)
  第4章  工作流:脚本
    4.1  运行代码
    4.2  RStudio自动诊断
  第5章  探索性数据分析
    5.1  简介
    5.2  问题
    5.3  变动
      5.3.1  对分布进行可视化表示
      5.3.2  典型值
      5.3.3  异常值
      5.3.4  练习
    5.4  缺失值
    5.5  相关变动
      5.5.1  分类变量与连续变量
  ……
  第6章  工作流:项目
第二部分  数据处理
  第7章  使用tibble实现简单数据框
  第8章  使用readr进行数据导入
  第9章  使用dplyr处理关系数据
  第10章  使用stringr处理字符串
  第11章  使用forcats处理因子
  第12章  使用lubridate处理日期和时间
第三部分  编程
  第13章  使用magrittr进行管道操作
  第14章  函数
  第15章  向量
  第16章  使用purrr实现迭代
第四部分  模型
  第17章  使用modelr实现基础模型
  第18章  模型构建
  第19章  使用purrr和broom处理多个模型
第五部分  沟通
  第20章  R Markdown
  第21章  使用ggplot2进行图形化沟通
  第22章  R Markdown输出类型
  第23章  R Markdown工作流
  作者简介
  封面简介