张晓丹,梁冰,王丽,白海燕,吕世炅,肖晶.网页自动分类融合模型研究[J].数字图书馆论坛,2011,(8):57~60 |
网页自动分类融合模型研究 |
Study on WEB Page Classification Fusion Model |
|
DOI: |
中文关键词: 网页自动分类;信息融合;融合模型;信息检索 |
英文关键词: WEB page classification, Information fusion, Fusion model, Information retrieval |
基金项目:本课题获以下项日基金资助:国家自然科学基金(基金号:60803050);“十二五”国家科技支撑计划项目(项目编号:2011BAH10B05);中国科学技术信息研究所预研项目(项目编号:YY-2010023) |
作者 | 单位 | 张晓丹 | 中国科学技术信息研究所 | 梁冰 | 中国科学技术信息研究所 | 王丽 | 中国科学技术信息研究所 | 白海燕 | 中国科学技术信息研究所 | 吕世炅 | 中国科学技术信息研究所 | 肖晶 | 中国科学技术信息研究所 |
|
摘要点击次数: 2042 |
全文下载次数: 1408 |
中文摘要: |
为了提高网页自动分类的准确率,基于信息融合的模型理论,提出了一种通用的网页自动分类模型和融合算法.该模型根据完成功能的不同分为四个层次:信息抽取层、数据预处理层、特征层和决策层,其中特征层是针对网页上不同种类的媒体信息采用不同的分类方法进行分类,并将分类结果分别输入决策层和与该特征层算法相关的其他的特征层.决策层是处理特征层的分类结果,并推导出最终的网页分类融合结果,并将该模型和算法进行了实现.实验表明,文章提出的融合模型和算法可以有效地改进网页自动分类准确率. |
英文摘要: |
For higher text classification precision, a general feature layer fusion classification model and algorithm are proposed, based on model theory of information fusion, adopting multi-information of the network for different classification, text and image information are used in the paper. The model includes two layers mainly, one is feature layer, which deals with different Media information with different classification algorithm, and inputs the classification results into the higher layer fusion centre separately. The other is decision layer, which deals with the results from the feature layer, and concludes the final classification result The experiment expresses the fusion model can improve the text classification precision effectively. |
查看全文
查看/发表评论 下载PDF阅读器 |
关闭 |
|
|
|