全部商品分类

您现在的位置: 全部商品分类 > 社科总论 > 社科总论 > 社会科学总论

学术Web主题结构挖掘研究

  • 定价: ¥45
  • ISBN:9787305198267
  • 开 本:16开 平装
  •  
  • 折扣:
  • 出版社:南京大学
  • 页数:204页
  • 作者:杨波
  • 立即节省:
  • 2018-11-01 第1版
  • 2018-11-01 第1次印刷
我要买:
点击放图片

导语

  

内容提要

  

    杨波著的《学术Web主题结构挖掘研究》是国家社科基金研究成果。Web主题显著性研究的本质是对网页(page)、网站(website)、域(domain)等不同层面的网络对象之间的主题关系进行描述、分析和度量。本课题设计了用于Web主题结构挖掘的数据采集策略,引入复杂网络方法来揭示存在于学术网络空间的主题集中规律,并提出学术网络社区主题显著度的量化评价指标,对基于复杂网络的网络主题社区发现算法进行定量和定性的评价。

作者简介

    杨波,男,南京农业大学信息管理系教授,博士生导师,主要研究方向为网络信息检索和信息计量。在《情报学报》、  《图书情报工作》、Journal of the Association for Information gcience and Technology、Scientometrics、Journal of Information Science等国内外权威期刊发表论文二十余篇。主持国家社科基金、教育部人文社科基金、南京农业大学青年科技创新基金等多个科研项目。首批入选南京农业大学“钟山学术新秀”,担任中国科学技术情报学会知识组织专业委员会委员,中国科技核心期刊《情报工程》编委。

目录

第一章  引言
  1.1  研究背景
    1.1.1  基于文本的主题聚类
    1.1.2  基于链接分析的主题聚类
    1.1.3  基于复合网页特征的主题聚类
    1.1.4  基于宏观网络拓扑结构的Web主题社区发现
    1.1.5  基于Web访问日志的用户社区发现
    1.1.6  基于Web主题图的信息浏览和检索可视化
  1.2  研究意义
  1.3  Web主题结构分析研究现状
    1.3.1  Web显著性指标研究
    1.3.2  基于学术Web的机构主题聚类研究
    1.3.3  非学术Web空间的行业主题显著性研究
    1.3.4  学术Web社区的地域影响因素研究
  1.4  研究内容
第二章  Web主题结构挖掘相关算法
  2.1  概述
  2.2  Web搜索中的主题分析算法
    2.2.1  主题敏感的PageRank
    2.2.2  HTTS
  2.3  基于图的社区发现算法
    2.3.1  Trawling
    2.3.2  最大流算法
  2.4  基于局部网络关系的社区发现算法
    2.4.1  基于共链的社区发现
    2.4.2  基于SNA的社区发现
  2.5  基于复杂网络的社区发现算法
    2.5.1  GN及其衍生算法
    2.5.2  基于模块度优化的算法
    2.5.3  派系过滤算法(CPM)
    2.5.4  LPA算法
    2.5.5  COPRA算法
    2.5.6  SLPA算法
    2.5.7  算法对比
  2.6  小结
第三章  Web主题结构挖掘中的数据采集技术研究
  3.1  相关研究
    3.1.1  概述
    3.1.2  搜索引擎
    3.1.3  通用Web信息采集工具
    3.1.4  自主开发的专用采集工具
  3.2  数据采集模型与策略
    3.2.1  数据采集模型
    3.2.2  链接解析
    3.2.3  链接统计规则
    3.2.4  页面选择与链接分类
    3.2.5  链接预测
  3.3  Web数据采集系统的设计
    3.3.1  总体架构
    3.3.2  功能介绍
    3.3.3  参数配置
    3.3.4  任务监控
  3.4  小结
第四章  学术Web宏观主题结构挖掘研究
  4.1  概述
  4.2  大学网站的链接特征
    4.2.1  链接动机
    4.2.2  链接集中规律
  4.3  封闭样本的数据采集和结构分析技术研究
    4.3.1  数据采集策略
    4.3.2  基于k核的链接结构分析研究
    4.3.3  基于复杂网络的链接结构挖掘研究
  4.4  实验
    4.4.1  样本选择
    4.4.2  数据有效性分析
    4.4.3  基于k核的社区发现结果分析
    4.4.4  基于力导向的社区发现结果分析
    4.4.5  基于复杂网络的社区发现结果分析和评测
    4.4.6  结果对比
  4.5  小结
第五章  多层次网络中的Web主题结构挖掘研究
  5.1  概述
  5.2  研究对象选择与数据预处理
    5.2.1  样本选取
    5.2.2  主题标注
    5.2.3  网站域名识别
  5.3  基于学院层面的主题显著度研究
    5.3.1  基本数据特征
    5.3.2  社区主题显著性评价指标
    5.3.3  社区主题结构分析算法性能比较
    5.3.4  社区主题结构分析结果
  5.4  基于大学层面的主题显著度研究
    5.4.1  基本网络特征
    5.4.2  主题特征优化策略
    5.4.3  不同阈值下的主题显著度分析
  5.5  小结
第六章  多维度机构网络主题一致性比较研究
  6.1  相关研究
  6.2  数据采集与预处理
  6.3  单一机构网络分析
    6.3.1  引用网络分析
    6.3.2  合著网络分析
  6.4  机构网络主题一致性比较
  6.5  小结
第七章  开放Web空间的主题结构挖掘研究
  7.1  社区扩展相关算法
    7.1.1  HITS
    7.1.2  Companion和Companion
    7.1.3  基于网页的社区发现研究的不足
  7.2  基于网站的社区扩展算法研究
    7.2.1  算法设计
    7.2.2  基于链接强度的样本选择规则
    7.2.3  基于域名结构的样本选择规则
    7.2.4  基于链接耦合的向下扩展
    7.2.5  基于链接评估的向上扩展
  7.3  基于开放集合的Web主题图实现框架和相关度评价
    7.3.1  实现框架
    7.3.2  社区成员相关度评价
  7.4  实验
    7.4.1  样本选择
    7.4.2  数据采集与处理
    7.4.3  基于核心扩展的Web主题图
    7.4.4  基于二次扩展的Web主题图
    7.4.5  多层次扩展的Web主题图结构对比
    7.4.6  基于核心扩展的Web主题图评价
    7.4.7  基于二次扩展的Web主题图评价
    7.4.8  研究结果对比
  7.5  小结
参考文献
附录