文章摘要
杨贺,杨奕虹,吴广印,林霄剑.用于海量文献关键词标引的计算机辅助加工系统构建实践*[J].数字图书馆论坛,2013,(6):44~50
用于海量文献关键词标引的计算机辅助加工系统构建实践*
Building Practice of ComputerAssistant Processing System for Massive Literature Keywords Indexing
  
DOI:
中文关键词: 文献加工;关键词标引;自动标引;计算机辅助加工系统
英文关键词: Literature processing;Keywords indexing;Automatic indexing;Computer assistant processing system
基金项目:本文系国家高科技发展计划(863计划)“云计算一期”重大专项课题“以科技文献为主的搜索引擎研制”子课题(编号2011AA01A206)成果之一。
作者单位
杨贺 北京万方数据股份有限公司 
杨奕虹 北京万方数据股份有限公司 
吴广印 北京万方数据股份有限公司 
林霄剑 北京万方数据股份有限公司 
摘要点击次数: 2109
全文下载次数: 1449
中文摘要:
      为缓解海量文献关键词标引的巨大压力,文章构建了用于海量文献关键词标引的计算机辅助加工系统,对标引数据预处理规范、自动标引核心工作区和人工标引校对平台进行了具体阐述。文章采用数据测试方法确定了自动标引软件,在单一软件不能满足标引要求后探索了多种机标结果后处理方式提升机标质量,最终由人工标引校对平台保证海量文献关键词标引质量的同时,将机标出现的问题和改进意见反馈给软件设计和词表维护,保证了计算机辅助加工系统的持续改进。
英文摘要:
      In order to all eviate the enormous pressure of the massive literature keywords indexing, the paper builds a computer assistant processing system for massive literature keywords indexing, and three modules are exposited, including Indexing data preprocessing specification, Automatic indexing core workspace and manual indexing proofreading system. The paper selects automatic indexing softwares by data testing, and discovers several combination modes to improve the quality of automatic indexing. The function of manual indexing proofreading system is designed to enhance the literature indexing quality and the whole system as well .
查看全文   查看/发表评论  下载PDF阅读器
关闭

分享按钮