曲军伟,乔晓东,桂婕.自组织映射在专利文本聚类中的应用研究[J].数字图书馆论坛,2010,(9):13~19 |
自组织映射在专利文本聚类中的应用研究 |
A Research on Patent Document Clustering-analysis Using Self-Organizing Map |
|
DOI: |
中文关键词: 自组织映射;专利聚类;文本挖掘;可视化 |
英文关键词: |
基金项目:本文得到国家科技部"十一五"科技支撑计划(项目编号:2006BAH03B03),中国科学技术信息研究所重点工作项目(项目编号:2009KP01-7-1)、中国科学技术信息研究所2009年度预研基金项目(项目编号:YY-200906)等项目的资助. |
作者 | 单位 | 曲军伟 | 中国科学技术信息研究所 | 乔晓东 | 中国科学技术信息研究所 | 桂婕 | 中国科学技术信息研究所 |
|
摘要点击次数: 2118 |
全文下载次数: 1419 |
中文摘要: |
自组织映射(SOM)是一种基于人工神经网络的聚类方法,通过将相似的输入数据映射到相同或者相近神经元达到相似相聚的目的,有着不需要先验知识,保持拓扑结构不变、无监督自我学习和易于可视化的优点.由于专利文献有着数量大、文字晦涩冗长、专业性强等特点,分析难度较大,自动聚类分析能挖掘专利文献内在相似性,作为基础性处理用于后期应用,例如专利数据清洗,专利检索,主题分析和专利地图生成等众多领域.基于SOM的专利文本聚类与传统聚类方法相比效率和准确率较高,并且易于可视化展示.本文使用了SOM、k-means和TwoStep算法分别在专利文本聚类中作了对比,得出SOM较优的结论. |
英文摘要: |
|
查看全文
查看/发表评论 下载PDF阅读器 |
关闭 |
|
|
|