全部商品分类

您现在的位置: 全部商品分类 > 电子电脑 > 电工无线电自动化 > 自动化技术

大数据清洗技术/航天先进技术研究与应用系列

  • 定价: ¥88
  • ISBN:9787560377537
  • 开 本:16开 平装
  • 作者:王宏志
  • 立即节省:
  • 2020-01-01 第1版
  • 2020-01-01 第1次印刷
我要买:
点击放图片

导语

  

内容提要

  

    本书主要介绍了大数据清洗方面的研究成果。全书共分7章,重点面向大数据清洗中计算困难、错误混杂、缺少知识等难题,针对实体识别、真值发现、缺失值填充、不一致检测与修复等问题提出了相应的技术和算法,并在第7章提出了多数据质量问题综合清洗与优化技术。
    本书可作为高等院校和科研机构大数据、数据质量管理、数据治理等方面的教学和科研参考书。

作者简介

    王宏志,哈尔滨工业大学计算机科学与技术学院副教授、博士生导师。研究方向包括大数据管理、数据质量、图数据管理。发表学术论文140余篇,出版学术专著两本,参与翻译《算法导论(第3版)》。在爱课程网、学堂在线、好大学在线上首次开设“大数据算法”在线课程,出版《大数据算法》教材。

目录

第1章  绪论
  1.1  大数据的定义及其应用
  1.2  数据质量问题
  1.3  大数据的质量问题与挑战
  1.4  数据清洗研究进展
  1.5  本书的内容
  本章参考文献
第2章  大数据处理技术概述
  2.1  大数据并行计算平台
  2.2  众包技术
  本章参考文献
第3章  实体识别
  3.1  实体识别概述
  3.2  串行实体识别算法
  3.3  并行实体识别算法
  3.4  增量实体识别算法
  3.5  基于众包的实体识别
  本章参考文献
第4章  真值发现
  4.1  真值发现算法概述
  4.2  并行真值发现算法
  4.3  增量真值发现算法
  4.4  基于众包的真值发现
  本章参考文献
第5章  缺失值填充
  5.1  缺失值填充算法概述
  5.2  基于贝叶斯网络的串行缺失值填充算法
  5.3  实验结果及分析
  5.4  并行缺失值填充算法
  5.5  基于众包的缺失值填充算法
  本章参考文献
第6章  不一致数据检测与修复
  6.1  不一致数据检测与修复概述
  6.2  并行不一致数据检测与修复算法
  6.3  基于众包的不一致数据检测与修复算法
  6.4  扫描数据一次的大数据不一致检测算法
  本章参考文献
第7章  多数据质量问题综合清洗与优化
  7.1  数据质量维度的关联
  7.2  基于任务合并的并行数据清洗优化
  7.3  综合大数据清洗系统
本章参考文献
名词索引