河北大学学报(自然科学版) ›› 2004, Vol. 24 ›› Issue (6): 657-661.DOI: 10.3969/j.issn.1000-1565.2004.06.021

• • 上一篇    下一篇

人名、机构名在基于概念的文本分类中的应用研究

吴志峰,田学东   

  1. 河北大学,数学与计算机学院,河北,保定,071002
  • 出版日期:2004-11-25 发布日期:2004-11-25
  • 基金资助:
    河北省自然科学基金

Application of Name of People and Institution in Text Categorization

  • Online:2004-11-25 Published:2004-11-25

摘要: 基于概念的文本分类方法,能对同义词、多义词进行比较好的处理,是一种比较优秀的文本分类算法.但是此方法往往对人名、机构名等具有分类特征的词不能很好地处理,依然停留在关键词的层次.提出了一种将语义词典与一部人名、机构名构成的专有名词词典相结合的新的概念分类方法,并经过实验验证了其有效性.

关键词: 文本分类, 概念分类, KNN, 朴素贝叶斯

中图分类号: