全部商品分类

您现在的位置: 全部商品分类 > 语言.文字 > 语言文字 > 语言学

语言变体语料库构建及计算模型

  • 定价: ¥68
  • ISBN:9787030599551
  • 开 本:16开 平装
  •  
  • 折扣:
  • 出版社:科学
  • 页数:158页
  • 作者:徐凡
  • 立即节省:
  • 2019-06-01 第1版
  • 2019-06-01 第1次印刷
我要买:
点击放图片

导语

  

内容提要

  

    近年来,语言变体研究受到了计算语言学界的广泛关注。本书从人工智能技术和语言变体相结合的视角,结合自然语言处理、机器学习、神经网络、语音识别、语料库语言学等相关技术,以作者的一系列研究成果为内容主线,系统介绍语言变体(相似语言)研究的语料库构建及计算模型。全书共9章,探索了相似语言及变体语料库的构建规范、多模态语音和文本)语料库的标注、语言变体文字和语音处理的计算模型。本书对相似语言及语言变体中的关键技术进行较为深入的研究,提出相关问题的一些解决方法,并设计相应的算法和实验。实验表明,本书提出的这些方法有助于提高相似语言的分析性能,同时减少对大规模语料库的依赖性,为今后的相似语言变体分析研究奠定了重要基础,为同类研究提供了参考。
    本书可作为从事自然语言处理、计算语言学、数据挖掘研究的科研、管理等相关人员的参考书,也可供高等院校语言学、智能科学与技术、管理科学与工程等教育类、信息类和管理类相关研究生及本科生使用。

目录

第1章  相似语言及变体研究概述
  1.1  相似语言及变体相关概念
  1.2  相似语言及变体研究综述
    1.2.1  语料库资源建设
    1.2.2  计算模型
    1.2.3  评测指标
  1.3  本章小结
  参考文献
第2章  相关技术
  2.1  传统技术
    2.1.1  支持向量机
    2.1.2  统计语言模型
    2.1.3  互信息
    2.1.4  相似度计算
    2.1.5  隐马尔可夫模型
  2.2  最新深度学习技术
    2.2.1  词向量
    2.2.2  神经网络语言模型
    2.2.3  word2vec模型
    2.2.4  多层感知机
    2.2.5  循环神经网络
    2.2.6  卷积神经网络
  2.3  本章小结
  参考文献
第3章  海峡两岸及香港地区三元组和词对齐语料库构建
  3.1  语言变体
  3.2  词对齐定义
  3.3  三元组和词对齐语料库
    3.3.1  处理框架
    3.3.2  标注规范
    3.3.3  三元组语料
    3.3.4  词对齐语料
  3.4  本章小结
  参考文献
第4章  海峡两岸及香港地区词对齐抽取计算模型
  4.1  相关工作
  4.2  基于word2vec的两阶段词对齐抽取模型
    4.2.1  阶段1模型
    4.2.2  阶段2模型
  4.3  基于词映射规则的词对齐抽取模型
    4.3.1  词对齐算法
    4.3.2  词映射规则后处理
  4.4  实验设置及结果分析
    4.4.1  实验设置
    4.4.2  评测指标
    4.4.3  实验结果分析
  4.5  本章小结
  参考文献
第5章  句子级中国、新加坡、马来西亚语言类型识别计算模型
  5.1  相关工作
  5.2  语言类型识别模型
    5.2.1  特征抽取
    5.2.2  分类器构建
  5.3  实验设置及结果分析
    5.3.1  实验设置
    5.3.2  实验结果分析
  5.4  本章小结
  参考文献
第6章  多模态赣方言篇章平行语料库构建
  6.1  赣方言概述
  6.2  多模态赣方言篇章平行语料库构建
    6.2.1  标注规范
    6.2.2  标注过程
    6.2.3  篇章级赣方言平行语料库标注实例
    6.2.4  语料统计及标注质量
  6.3  本章小结
  参考文献
第7章  句子级赣方言语言类型文本识别计算模型
  7.1  基于特征抽取的赣方言识别模型
    7.1.1  特征抽取
    7.1.2  分类器构建
  7.2  基于深度学习的赣方言识别模型
  7.3  实验设置及结果分析
    7.3.1  实验设置
    7.3.2  实验结果分析
  7.4  本章小结
  参考文献
第8章  赣方言语音识别计算模型
  8.1  语音识别简介
    8.1.1  语音识别框架
    8.1.2  国内外研究现状
  8.2  基Kaldi的赣方言语音识别
    8.2.1  Kaldi简介
    8.2.2  赣方言语音识别模型
  8.3  实验设置及结果分析
    8.3.1  实验设置
    8.3.2  评测指标
    8.3.3  实验结果分析
  8.4  本章小结
  参考文献
第9章  听音识人——端到端赣方言点识别计算模型及平台
  9.1  基于语音识别的赣方言点识别基准模型
    9.1.1  模型框架
    9.1.2  基准模型实验设置
    9.1.3  基准模型实验结果分析
  9.2  语音驱动的赣方言识别模型
    9.2.1  基于语音特征的模型框架
    9.2.2  混合模型
  9.3  实验设置及结果分析
    9.3.1  实验设置
    9.3.2  实验结果分析
  9.4  听音识人——赣方言智能处理平台
    9.4.1  PC型界面
    9.4.2  移动型界面
  9.5  本章小结
附录  计算机自动抽取的海峡两岸及香港地区三元组