设为首页 - 加入收藏
广告 1000x90
您的当前位置:黄大仙精准预测2015 > 句法关系 > 正文

《中文信息学报》新刊概览∣ 2019年第4期(33卷第4期)

来源:未知 编辑:admin 时间:2019-06-18

  抽象语义表示(abstract meaning representation, AMR)是一种领域无关的句子语义表示方法,它将一个句子的语义抽象为一个单根有向无环图,AMR解析旨在将句子解析为对应的AMR图。目前,中文AMR研究仍然处于起步阶段。该文结合中文AMR特性,采用基于转移神经网络的方法对中文AMR解析问题展开了试验性研究。首先,实现了一个基于转移解码方法的增量式中文AMR解析神经网络基线系统;然后,通过引入依存路径语义关系表示学习和上下文相关词语语义表示学习,丰富了特征的表示;最后,模型中应用序列化标注的模型实现AMR概念识别,优化了AMR概念识别效果。实验结果表明,该模型在中文AMR解析任务中达到了0.61的Smatch

  引用格式:吴泰中,顾敏,周俊生,曲维光,李斌,顾彦慧. 基于转移神经网络的中文AMR解析[J]. 中文信息学报, 2019, 33(4): 1-11.

  摘 要:语义双关语是幽默、笑话和喜剧等作品的来源之一,在人类写作的发展进程中具有重要的历史地位。由于语义双关语存在歧义难懂的特点,因此难以挖掘语义双关语的潜在语义信息,故目前语义双关语的检测和双关词的定位是自然语言处理任务中的一项困难和挑战。该文在语义双关语的理论基础上,挖掘了一系列的潜在语义特性,并构建了对应每个特性的特征集,用以检测语义双关语;同时从潜在语义特性出发,提出了一种基于词向量和同义词融合的语义相似度匹配算法实现语义双关词的定位。在SemEval 2017 Task 7和Pun of the Day数据集上均取得了较好的实验结果,验证了该文所提出的检测算法和定位算法。

  引用格式:刁宇峰,杨亮,林鸿飞,吴迪,樊小超,徐博,许侃. 基于潜在语义特性的语义双关语检测及双关词定位[J]. 中文信息学报, 2019, 33(4): 12-19,28.

  摘 要:名词短语一直是中外语言学领域的重要研究对象,近年来在自然语言处理领域也受到了研究者的持续关注。英文方面,已建立了一定规模的名词短语语义关系知识库。但迄今为止,尚未建立相应或更大规模的描述名词短语语义关系的中文资源。该文借鉴国内外诸多学者对名词短语语义分类的研究成果,对大规模真实语料中的基本复合名词短语实例进行试标注与分析,建立了中文基本复合名词短语语义关系体系及相应句法语义知识库,该库能够为中文基本复合名词短语句法语义的研究提供基础数据资源。目前该库共含有18 281条高频基本复合名词短语,每条短语均标注了语义关系、短语结构及是否指称实体等信息,每条短语包含的两个名词还分别标注了语义类信息。语义类信息基于北京大学《现代汉语语义词典》。基于该知识库,该文还做了基本复合名词短语句法语义的初步统计与分析。

  引用格式:刘鹏远,刘玉洁. 中文基本复合名词短语语义关系体系及知识库构建[J]. 中文信息学报, 2019, 33(4): 20-28.

  摘要:词语作为语言模型中的基本语义单元,在整个语义空间中与其上下文词语具有很强的关联性。同样,在语言模型中,通过上下文词可判断出当前词的含义。词表示学习是通过一类浅层的神经网络模型将词语和上下文词之间的关联关系映射到低维度的向量空间中。然而,现有的词表示学习方法往往仅考虑了词语与上下文词之间的结构关联,词语本身所蕴含的内在语义信息却被忽略。因此,该文提出了DEWE词表示学习算法,该算法可在词表示学习的过程中不仅考量词语与上下文之间的结构关联,同时也将词语本身的语义信息融入词表示学习模型,使得训练得到的词表示既有结构共性也有语义共性。实验结果表明,DEWE算法是一种切实可行的词表示学习方法,相较于该文使用的对比算法,DEWE在6类相似度评测数据集上具有优异的词表示学习性能。

  引用格式:冶忠林,赵海兴,张科,朱宇. 基于描述约束的词表示学习[J]. 中文信息学报, 2019, 33(4): 29-36.

  摘要:词向量是一种词语的数字化的表达。基于神经网络模型,利用语料中词语之间的上下文关系这一约束条件,通过大量训练得到词向量。词向量在表达词的语义上的表现给人以无限的希望与想象空间,基于词向量的文本分类、人机对话、智能检索等得到了广泛的研究。该文针对校园信息查询的特定应用,建立了所涉及词语的分类本体,除了利用语料中词语上下文关系外,还将本体知识作为约束条件进行词向量的训练,增强了词向量的语义表达。基于skip-gram模型,采用多任务的神经网络训练方法,在自己收集的语料上训练得到了针对领域的词向量。实验表明,基于领域知识的增强约束词向量能够更准确地表达词的语义信息。

  引用格式:王恒升,刘通,任晋. 基于领域知识的增强约束词向量[J].中文信息学报, 2019, 33(4): 37-47.

  摘要:随着计算机技术的迅猛发展,自然语言处理成为计算机科学领域与人工智能领域中的一个重要方向,且文本知识获取(knowledge acquisition from text, KAT)是人工智能的重要研究内容。当前对于文本研究,大多采用关键字以及机器学习方法,准确率并不高。该文提出了一种基于语义文法的中文网络攻击事件知识获取方法。首先介绍参考FrameNet构建的语义分类和描述框架,它在现代汉语基本句模分类的基础上进行了扩充和改进。其次,重点介绍了攻击文本中最常见的遭受类语义类的设计和形成过程。然后将语义分类和描述框架应用在“网络安全”领域,形成“网络攻击语义类”,并介绍在建立“网络攻击语义类”时遇到的难题,包括文法的设计中对事元的确定、复合句的处理、“的是”结构句型的分析设计、谓词设计等。最后,使用国家某安全部门提供的真实数据进行网络攻击知识抽取,实验表明该方法具有较高的准确率。

  关键词:语义分类和描述框架;知识抽取;语义文法;遭受语义类;网络安全知识库

  引用格式:方芳,王亚,王石,符建辉,曹存根. 基于语义分类和描述框架的网络攻击知识抽取研究及其应用[J]. 中文信息学报, 2019, 33(4): 48-59.

  摘要:汉盲转换是指将汉字文本自动转换为对应的盲文文本,其在盲文出版、盲人教育等领域具有重要应用价值,但当前已有系统性能难以满足实用需求。该文提出一种基于汉盲对照语料库和深度学习的汉盲自动转换方法,首次将深度学习技术引入该领域,采用按照盲文规则分词的汉字文本训练双向LSTM模型,从而实现准确度高的盲文分词。为支持模型训练,提出了从不精确对照的汉字和盲文文本中自动匹配抽取语料的方法,构建了规模为27万句、234万字、448万方盲文的篇章、句子、词语多级对照的汉盲语料库。实验结果表明,该文所提出的基于汉盲对照语料库和深度学习的汉盲转换方法准确率明显优于基于纯盲文语料库和传统机器学习模型的方法。

  引用格式:蔡佳,王向东,唐李真,崔晓娟,刘宏,钱跃良. 基于汉盲对照语料库和深度学习的汉盲自动转换[J]. 中文信息学报, 2019, 33(4): 60-67.

  摘要:文本自动撰写在自然语言处理中是一个重要的研究领域,可通过人工智能的方法来提升文本的生成结果。目前主流的生成方法是基于深度学习的方法,而该文则提出了一种基于注意力的端到端模型生成藏文律诗法。该方法基本框架是一个双向LSTM的编码—解码模型,在此基础上引入了藏文字嵌入、注意力机制和多任务学习法。实验结果表明,该文提出的方法在藏文律诗生成结果中BLEU值和ROUGE值分别能达到59.27% 、62.34%,并无需任何人为的特征设置。

  引用格式:色差甲,华果才让,才让加,慈祯嘉措,柔特. 注意力的端到端模型生成藏文律诗[J]. 中文信息学报, 2019, 33(4): 68-74.

  摘要:Web表格知识抽取是一种重要的获取高质量知识的途径,在知识图谱、网页挖掘等方面具有广泛的研究意义与应用价值。传统的Web表格知识抽取方法主要依赖于良好的表格结构和足够的先验知识,但在复杂的表格结构以及先验知识不足等情形下难以奏效。针对这类方法的问题,该文通过充分利用表格自身的结构特点,提出了一套可面向大规模数据的基于等价压缩快速聚类的Web表格知识抽取方法,以无监督的聚类方式获得相似形式结构的表格,从而推测其语义结构以抽取知识。实验结果表明,基于等价压缩的快速聚类算法在保持同水平的聚类准确率的前提下,在时间性能上相比传统方法有大幅度的提升,5000个表格的聚类时间由72小时缩短为20分钟,且在表格聚类后利用表格模板所抽取的知识三元组的准确率也达到了令人满意的结果。

  引用格式:吴小龙,曹存根. 基于等价压缩快速聚类的Web表格知识抽取[J]. 中文信息学报, 2019, 33(4): 75-84.

  摘要:传统中文事件检测方法采用人工定义的特征表示候选触发词,耗时耗力。基于神经网络的特征学习方法在中英文事件检测任务中得到了验证。现有的基于神经网络的中文事件检测方法初步探索了字信息对解决分词错误的作用。字是中文的最小结构单元和语义表示单元。词语的字符级信息能够提供词语的结构性信息和辅助词语级语义。该文研究了字/词混合神经网络特征对于解决中文事件数据集未登录词问题的作用。采用神经网络模型分别学习词语的词语级表示和字符级表示,进而拼接得到词语的混合表示。实验结果表明,基于字/词混合表示的中文神经网络事件检测模型的F1值比当前最好的模型高2.5%。

  引用格式:秦彦霞,王中卿,郑德权,张民. 基于混合表示的中文事件检测方法研究[J]. 中文信息学报, 2019, 33(4): 85-92.

  摘要:针对新闻文本领域,该文提出一种基于查询的自动文本摘要技术,更加有针对性地满足用户信息需求。根据句子的TF-IDF、与查询句的相似度等要素,计算句子权重,并根据句子指示的时间给定不同的时序权重系数,使得最近发生的新闻内容具有更高的权重,最后使用最大边界相关的方法选择摘要句。通过与基于TF-IDF、Text-Rank、LDA等六种方法的对比,该摘要方法ROUGE评测指标上优于其他方法。从结合评测结果及摘要示例可以看出,该文提出的方法可以有效地从新闻文档集中摘取核心信息,满足用户查询内容的信息需求。

  引用格式:王凯祥,任明. 基于查询的新闻多文档自动摘要技术研究[J]. 中文信息学报, 2019, 33(4): 93-100.

  摘要:当前的足球比赛新闻通常是由专家或记者手工撰写的,足球比赛新闻的手工写作既费时又低效。随着在线直播平台与社交媒体的流行,体育网络直播脚本大幅增加,但网络直播脚本通常只记载一场比赛的流水,具有冗长且重点模糊的特性,不适宜于赛后直接阅读。为了解决以上问题,在比赛之后,可以基于直播脚本撰写和发布足球比赛新闻。因此,该文提出一种从网络直播脚本直接生成足球比赛新闻的方法。该方法基于卷积神经网络和足球新闻篇章结构,从足球比赛过程中的多个时间段提取出已发生的重要事件,进而抽取相关句子来生成足球新闻,同时,该方法还会针对比赛评价生成一个简短总结。实验结果表明,使用该方法从网络直播脚本生成足球新闻是可行的。

  引用格式:刘茂福,齐乔松,胡慧君. 基于卷积神经网络与篇章结构的足球新闻自动生成方法[J]. 中文信息学报, 2019, 33(4): 101-108.

  摘要:该文提出了一种基于复杂网络分析方法的小说人物关系识别模型。通过以金庸14部武侠小说的分析过程为样例,首先提出了基于小说社会网络关系的降噪分析框架,然后在此基础上构建了人物亲密度评估与关系判别模型,最后给出了一种识别小说主角复杂爱情模式的通用模型。实验发现该模型能够有效地分析出小说中的复杂爱情模式,且在保证识别效率的同时还具备较高的精准度。在模型训练时,设置了变尺度窗口,发现随着窗口的变小,模型识别的主角复杂爱情模式呈现出召回率会不断上升至稳定,同时精确率则会维持相对稳定至超过一个阈值后不断下降这一重要现象。该文提出的复杂爱情模式识别框架,不仅对长文本小说人物关系分析具有较好的借鉴意义,还可以应用于判断小说精彩性和小说内容个性化推荐的图书决策支持系统。

  引用格式:张旋,梁循,李志宇,张树森,赵晓磊. 金庸小说中主角复杂爱情模式的识别与分析[J]. 中文信息学报, 2019, 33(4): 109-119.

  摘要:属性分类是属性级情感分析中的一个重要任务。该任务旨在对文本包含的某些具体属性进行自动分类。已有的属性分类方法研究基本都是面向新闻、评论等文本类型。与已有研究不同的是,该文的研究主要面向问答文本的属性分类任务。针对问答文本的属性分类问题,该文提出了一种多维文本表示的方法。首先,该方法进行中文句子切分;其次,使用LSTM模型对每个子问题和答案学习一个隐层表示;再其次,通过融合多个隐层表示,形成多维文本表示;最后,使用卷积层处理多维文本表示,获得最终分类结果。实验结果表明该方法明显优于传统的属性分类方法。

  引用格式:江明奇,沈忱林,李寿山. 面向问答文本的属性分类方法[J].中文信息学报, 2019, 33(4): 120-126.

  摘要:随着自动大规模语音识别的不断发展,以自动语音识别为基础的计算机辅助发音教学也随之进步,作为传统教学方法的补充,它极大地弥补了传统教育资源不足以及传统教育方法无法及时给学习者反馈的缺陷。二语学习者的发音偏误确认和评价在计算机辅助发音训练中是较为重要的研究课题之一。针对二语者发音偏误的确认任务中缺少二语偏误发音标注问题,该文提出了一种基于声学音素向量和孪生网络的方法,将带有配对信息的成对的语音特征作为系统输入,通过神经网络将语音特征映射到高层表示,期望将不同的音素区分开。训练过程引入了孪生网络,依照输出的两个音素向量是否来自于同一类音素来调整和优化输出向量之间的距离,并通过相应的损失函数实现优化过程。结果表明使用基于余弦最大间隔距离损失函数的孪生网络获得了89.93%的准确率,优于实验中其它方法。此方法应用在发音偏误确认任务时,不使用标注的二语发音偏误数据训练的情况下,也获得了89.19%的诊断正确率。

  引用格式:王振宇,解焱陆,张劲松. 基于声学音素向量和孪生网络的二语者发音偏误确认[J]. 中文信息学报, 2019, 33(4): 127-134.

  摘要:该文的研究工作针对硬笔汉字篇章书写练习的智能评价与指导需求展开。在PAD等数字录入设备支持的联机书写状态下,以记录书写笔迹的时序点集为依据,先实现分行割字,再进行行水平、行间距稳定性、行间距均匀性、字间距均匀性和左对齐等的计算并获得特征参量。最终通过专家经验赋权法给出直观的书写质量评价结果。实验表明,该系统可以对篇章书写质量给出较符合主观习惯的评价,能够用于指导书写者进行汉字篇章书写练习。

  引用格式:许明月,姜杰,李艺,仇宏斌. 联机汉字篇章书写质量评价研究[J]. 中文信息学报, 2019, 33(4): 135-142.

本文链接:http://pinoyradio-uk.com/jufaguanxi/252.html

相关推荐:

网友评论:

栏目分类

现金彩票 联系QQ:24498872301 邮箱:24498872301@qq.com

Copyright © 2002-2011 DEDECMS. 现金彩票 版权所有 Power by DedeCms

Top