河北大学学报(自然科学版) ›› 2007, Vol. 27 ›› Issue (3): 327-331.DOI: 10.3969/j.issn.1000-1565.2007.03.024

• • 上一篇    下一篇

一种改进的朴素贝叶斯文本分类方法

梁宏胜1,徐建民2,成岳鹏2   

  1. 1.河北大学,数学与计算机学院,河北,保定,071002;河北大学,校园规划处,河北,保定,071002; 2.河北大学,数学与计算机学院,河北,保定,071002
  • 出版日期:2007-05-25 发布日期:2007-05-25
  • 基金资助:
    河北省科学技术研究与发展计划

An Improving Text Categorization Method of Na(i)ve Bayes

LIANG Hong-sheng1,XU Jian-min2,CHENG Yue-peng2   

  • Online:2007-05-25 Published:2007-05-25

摘要: 朴素贝叶斯分类器是一种简单有效的文本分类方法.改进方法利用同义词对文本的特征词集进行过滤,在一定程度上放松了朴素贝叶斯的特征独立性假设;在特征选择时迭代了2种不同的特征选择方法,有效地提高了特征集的代表性.实验结果表明,本方法有效地提高了朴素贝叶斯分类器的性能.

关键词: 文本分类, 朴素贝叶斯, 特征抽取, 同义词

中图分类号: