设为首页 - 加入收藏
广告 1000x90
您的当前位置:黄大仙精准预测2015 > 句法规则 > 正文

基于词表和句法规则的社会化标签分类研究

来源:未知 编辑:admin 时间:2019-05-17

  以中国最大的电影标注系统豆瓣网675351位用户的标签数据为例进行实验,实验的召回率为95.01%、准确率为96.19%、F1-measure为95.32%,结果表明这种方法可以较好地实现标签自动分类工作

  标签作为用户对资源的描述,在信息组织、信息检索中有着广泛的应用,然而,其结构扁平化、语义混乱的情况限制了其应用范围。词表作为图书馆学情报学领域的经典技能,对类目、主题词等做了规范化处理,保证了语义的准确性,揭示类目和词汇的关系,结合受控词表进行分众分类系统的优化已有较好的实践先例,其适用于处理用户对资源的客观且相对规范的描述;而规则作为特征提取、文本分类的常用方法,在Web2.0时代的应用范围不断拓展,适用于处理词表范围之外、用户出于自身认知而对资源进行的自然语言描述。两种方法侧重不同,对不同类型的标签类型识别各有优势。基于此,本文提出了一种结合自建词表和句法规则的标签自动分类方法,方法结合了词表规范性、标准化的优势与规则在自动分类方面的能力,以豆瓣电影标签数据为样本进行实验,取得了较好的效果,为基于标签的资源组织、资源检索等实践工作提供了参考,为相关理论的拓展提供借鉴。当然,本文也存在一定的局限性,如基于规则的评价类标签的召回率不高,以及未对个人标签和其他标签制定相应规则,针对这些问题,本文拟在今后的研究中逐一进行解决,并在此基础上开展基于标签的分面检索系统设计或标签推荐等相关工作,扩大标签的利用范围。

  [3]熊回香,王学东.大众分类体系中标签概念空间的构建研究[J].情报学报,2012,31(9):984-992.

  [6]李蕾,王冕,章成志.区分标签类型的社会化标签质量测评研究[J].图书情报工作,2013,57(23):11-16,9.

  [13]李静,林鸿飞,李瑞敏.基于情感向量空间模型的歌曲情感标签预测模[J].中文信息学报,2012,26(6):45-50.

  [14]李纲,刘广兴,毛进,等.一种基于句法分析的情感标签抽取方法[J].图书情报工作,2014,58(14):12-20.

  [17]崔晓莉.从社会性标签中进行语义关系抽取——一种元数据生成方法[J].现代图书情报技术,2009,25(3):38-45.

  [18]聂卉,杜嘉忠.依存句法模板下的商品特征标签抽取研究[J].现代图书情报技术,2014,30(12):44-50.

本文链接:http://pinoyradio-uk.com/jufaguize/54.html

相关推荐:

网友评论:

栏目分类

现金彩票 联系QQ:24498872301 邮箱:24498872301@qq.com

Copyright © 2002-2011 DEDECMS. 现金彩票 版权所有 Power by DedeCms

Top