全部商品分类

您现在的位置: 全部商品分类 > 电子电脑 > 计算机技术 > 程序与语言

数据科学之编程技术(使用R进行数据清理分析与可视化)/数据科学与工程技术丛书

  • 定价: ¥99
  • ISBN:9787111640899
  • 开 本:16开 平装
  •  
  • 折扣:
  • 出版社:机械工业
  • 页数:253页
  • 作者:(美)迈克尔·弗里...
  • 立即节省:
  • 2020-01-01 第1版
  • 2020-01-01 第1次印刷
我要买:
点击放图片

导语

  

内容提要

  

    本书由资深数据科学专家撰写,围绕使用R进行数据科学编程所需的实际步骤展开,介绍了有关该主题的工具和技术的整个生态系统,Amazon全五星评价。全书共六部分,21章。第一部分(第1~2章)讲述了下载和安装本书其他部分所需软件的步骤,其中第1章详细介绍了如何安装文本编辑器、Bash终端、R解释器和RStudio程序,第2章描述了如何使用命令行进行基本的文件系统浏览。第二部分(第3~4章)介绍了项目管理的基础技术,其中第3章介绍了用于逐行跟踪代码变化的git软件、相应的流行代码托管和协作服务器GitHub,第4章描述了如何使用Markdown生成用于共享和展示数据所需的结构良好且样式良好的文档。第三部分(第5~8章)介绍R编程语言,其中第5章讲解R语言的基本语法,第6章描述诸如函数之类的基本编程概念和该语言的基本数据结构,第7章和第8章分别讲解向量和列表。第四部分(第9~14章)讲解数据清理,其中第9章介绍用于理解真实数据结构的技术与概念,第10章讲解R中常用于管理数据的数据结构——数据框,第11章和第12章描述R中交互编程处理数据的两个包——dplyr和tidyr,第13章和第14章详细描述如何使用应用程序编程接口从数据库和基于Web的数据服务中加载数据。第五部分(第15~17章)讲解数据可视化,其中第15章概述数据可视化的原则,第16章详细描述如何在R中使用ggplot2可视化包,第17章介绍3个R扩展包。第六部分(第18~21章)讲解如何构建与共享应用程序,其中第18章讲解如何使用R Markdown将分析转换为可共享文档与网站,第19章描述Shiny框架(可以借助该框架使用R来创建交互式Web应用程序),第20章描述如何进行协作,第21章则详细说明了如何在本书以外拓展自己的知识。

目录

译者序

前言
第一部分 开始
第1章  设置计算机
  1.1  设置命令行工具
    1.1.1  Mac上的命令行
    1.1.2  Windows上的命令行
    1.1.3  Linux上的命令行
  1.2  安装git
  1.3  创建GitHub账户
  1.4  选择一个文本编辑器
    1.4.1  Atom
    1.4.2  Visual Studio Code
    1.4.3  Sublime Text
  1.5  下载R语言
  1.6  下载RStudio
第2章  使用命令行
  2.1  访问命令行
  2.2  浏览文件系统
    2.2.1  改变目录
    2.2.2  列出文件
    2.2.3  路径
  2.3  管理文件
    2.3.1  学习新命令
    2.3.2  通配符
  2.4  错误处理
  2.5  重定向输出
  2.6  网络命令
第二部分 项目管理
第3章  使用git和GitHub进行版本控制
  3.1  什么是git
    3.1.1  git的核心概念
    3.1.2  什么是GitHub
  3.2  配置和项目设置
    3.2.1  生成一个仓库
    3.2.2  检查状态
  3.3  跟踪项目变更
    3.3.1  添加文件
    3.3.2  提交
    3.3.3  审核本地git流程
  3.4  在GitHub中存储项目
    3.4.1  分支和克隆
    3.4.2  推送和拉取
  3.5  访问项目历史
    3.5.1  提交历史
    3.5.2  恢复早期版本
  3.6  忽略项目中的文件
第4章  使用Markdown制作文档
  4.1  编写Markdown
    4.1.1  文本格式
    4.1.2  文本块
    4.1.3  超链接
    4.1.4  图像
    4.1.5  表格
  4.2  渲染Markdown
第三部分 R的基本技能
第5章  R语言
  5.1  用R编程
  5.2  运行R代码
    5.2.1  使用RStudio
    5.2.2  从命令行运行R
  5.3  注释
  5.4  变量定义
    5.4.1  基本数据类型
  5.5  获取帮助
    5.5.1  如何学习R
第6章  函数
  6.1  什么是函数
    6.1.1  R函数语法
  6.2  内置R函数
    6.2.1  命名参数
  6.3  加载函数
  6.4  编写函数
    6.4.1  调试函数
  6.5  使用条件语句
第7章  向量
  7.1  什么是向量
    7.1.1  创建向量
  7.2  向量化操作
    7.2.1  循环
    7.2.2  多数为向量
    7.2.3  向量化函数
  7.3  向量索引
    7.3.1  多索引
  7.4  向量过滤
  7.5  向量修改
第8章  列表
  8.1  什么是列表
  8.2  创建列表
  8.3  访问列表元素
  8.4  修改列表
    8.4.1  单双括号
  8.5  lapply()函数
第四部分 数据清理
第9章  理解数据
  9.1  数据生成过程
  9.2  查找数据
  9.3  数据类型
    9.3.1  测量尺度
    9.3.2  数据结构
  9.4  解释数据
    9.4.1  获取领域知识
    9.4.2  了解数据模式
  9.5  用数据回答问题
第10章  数据框
  10.1  什么是数据框
  10.2  使用数据框
    10.2.1  创建数据框
    10.2.2  数据帧的结构
    10.2.3  访问数据框
  10.3  使用CSV数据
    10.3.1  工作目录
    10.3.2  因子变量
第11章  使用dplyr操作数据
  11.1  操作数据语法
  11.2  核心dplyr函数
    11.2.1  选择
    11.2.2  过滤
    11.2.3  修改
    11.2.4  排序
    11.2.5  汇总
  11.3  执行顺序操作
    11.3.1  管道操作
  11.4  按组分析数据框
  11.5  连接数据框
  11.6  dplyr实战:分析飞行数据
第12章  使用tidyr重塑数据
  12.1  什么是“整洁”数据
  12.2  从列到行:gather()
  12.3  从行到列:spread()
  12.4  tidyr实战:探索教育统计
第13章  访问数据库
  13.1  关系数据库概述
    13.1.1  什么是关系数据库
    13.1.2  建立关系数据库
  13.2  体验SQL
  13.3  从R访问数据库
第14章  访问Web API
  14.1  什么是Web API
  14.2  RESTful请求
    14.2.1  URI(统一资源标识符)
    14.2.2  HTTP动词
  14.3  从R访问Web API
  14.4  处理JSON数据
    14.4.1  解析JSON
    14.4.2  展平数据
  14.5  API实战:在西雅图寻找古巴食品
第五部分 数据可视化
第15章  设计数据可视化
  15.1  可视化的目的
  15.2  选择可视化布局
    15.2.1  可视化单个变量
    15.2.2  可视化多个变量
    15.2.3  可视化分层数据
  15.3  选择有效的图形编码
    15.3.1  有效颜色
    15.3.2  利用前注意属性
  15.4  数据显示的表达力
  15.5  强化美学
第16章  使用ggplot2创建可视化
  16.1  图形语法
  16.2  使用ggplot2进行基本绘图
    16.2.1  指定几何图形
    16.2.2  美学映射
  16.3  复杂的布局及定制
    16.3.1  位置调整
    16.3.2  标度样式
    16.3.3  坐标系
    16.3.4  分面
    16.3.5  标签和注释
  16.4  构建地图
    16.4.1  分级统计(Choropleth)地图
    16.4.2  点分布地图
  16.5  ggplot2实战:绘制旧金山驱逐地图
第17章  R中的交互式可视化
  17.1  plotly包
  17.2  rbokeh包
  17.3  leaflet 包
  17.4  交互式可视化实战:展示西雅图的变化
第六部分 构建和共享应用程序
第18章  使用R Markdown创建动态报告
  18.1  设置报告
    18.1.1  新建.Rmd文件
    18.1.2  编织(Knit)文档
  18.2  集成Markdown与R代码
    18.2.1  R代码块
    18.2.2  内联代码
  18.3  在报告中渲染数据与可视化
    18.3.1  渲染字符串
    18.3.2  渲染Markdown列表
    18.3.3  渲染表格
    18.3.4  渲染绘图
  18.4  以网站形式共享报告
  18.5  R Markdown实战:寿命预测报告
第19章  使用Shiny构建交互式Web应用程序
  19.1  Shiny框架
    19.1.1  Shiny核心概念
    19.1.2  程序结构
  19.2  设计用户界面
    19.2.1  静态内容
    19.2.2  动态输入
    19.2.3  动态输出
    19.2.4  布局
  19.3  开发应用程序服务器
  19.4  发布Shiny应用程序
  19.5  Shiny实战:可视化警察致命射击
第20章  协同工作
  20.1  使用分支跟踪代码的不同版本
    20.1.1  不同分支
    20.1.2  合并分支
    20.1.3  合并冲突
    20.1.4  GitHub的合并
  20.2  使用特性分支开发项目
  20.3  使用集中工作流协作
    20.3.1  新建一个集中仓库
    20.3.2  在集中工作流中使用特性分支
  20.4  使用分叉工作流协作
第21章  继续学习
  21.1  统计学习
    21.1.1  评估关系
    21.1.2  预测
  21.2  其他编程语言
  21.3  道德准则