黄绍杉,乔晓东,桂婕,李鹏.基于条件随机场的专利摘要信息抽取研究[J].数字图书馆论坛,2010,(9):7~12 |
基于条件随机场的专利摘要信息抽取研究 |
Information Extraction of Patent Summary Based on Conditional Random Fields |
|
DOI: |
中文关键词: 专利摘要;信息抽取;条件随机场 |
英文关键词: |
基金项目:本文得到国家科技部"十一五"科技支撑计划(项目编号:2006BAH03B03),中国科学技术信息研究所重点工作项目(项目编号:2009KP01-7-1)、中国科学技术信息研究所2009年度预研基金项目(项目编号:YY-200906)等项目的资助. |
作者 | 单位 | 黄绍杉 | 中国科学技术信息研究所 | 乔晓东 | 中国科学技术信息研究所 | 桂婕 | 中国科学技术信息研究所 | 李鹏 | 中国科学技术信息研究所 |
|
摘要点击次数: 2132 |
全文下载次数: 1354 |
中文摘要: |
专利摘要是重要的情报分析数据来源,但其自然语言文本的特征,使得专利摘要的自动内容抽取具有较大难度.文章利用亚洲语言信息检索测评会议(NACSIS Test Collections for IR,NTCIR)提供的英文专利文摘测试语料,采用文本信息抽取统计方法中的条件随机场模型,通过提取并添加有效的特征,有针对性地抽取专利摘要中表示技术和功效内容的信息,为专利的技术功效矩阵分析提供可机器自动抽取的强大支持. |
英文摘要: |
|
查看全文
查看/发表评论 下载PDF阅读器 |
关闭 |
|
|
|