一种改进的朴素贝叶斯文本分类方法

doi:10.3969/j.issn.1000-1565.2007.03.024

河北大学学报(自然科学版) ›› 2007, Vol. 27 ›› Issue (3): 327-331.DOI: 10.3969/j.issn.1000-1565.2007.03.024

一种改进的朴素贝叶斯文本分类方法

梁宏胜¹,徐建民²,成岳鹏²

1.河北大学,数学与计算机学院,河北,保定,071002;河北大学,校园规划处,河北,保定,071002； 2.河北大学,数学与计算机学院,河北,保定,071002

出版日期:2007-05-25 发布日期:2007-05-25
基金资助:
河北省科学技术研究与发展计划

An Improving Text Categorization Method of Na(i)ve Bayes

LIANG Hong-sheng¹,XU Jian-min²,CHENG Yue-peng²

Online:2007-05-25 Published:2007-05-25

摘要/Abstract

摘要： 朴素贝叶斯分类器是一种简单有效的文本分类方法.改进方法利用同义词对文本的特征词集进行过滤,在一定程度上放松了朴素贝叶斯的特征独立性假设;在特征选择时迭代了2种不同的特征选择方法,有效地提高了特征集的代表性.实验结果表明,本方法有效地提高了朴素贝叶斯分类器的性能.

关键词: 文本分类, 朴素贝叶斯, 特征抽取, 同义词

中图分类号:

TP391

梁宏胜,徐建民,成岳鹏. 一种改进的朴素贝叶斯文本分类方法[J]. 河北大学学报(自然科学版), 2007, 27(3): 327-331.

LIANG Hong-sheng,XU Jian-min,CHENG Yue-peng. An Improving Text Categorization Method of Na(i)ve Bayes[J]. Journal of Hebei University (Natural Science Edition), 2007, 27(3): 327-331.

[1]	刘佩鑫,于洪志,徐涛. 基于朴素贝叶斯的档案分类研究[J]. 河北大学学报(自然科学版), 2018, 38(5): 549-554.
[2]	张锡忠,徐建民. 基于术语同义关系的文档相似度研究[J]. 河北大学学报(自然科学版), 2017, 37(1): 108-112.
[3]	湛燕,陈昊. 基于主题本体扩展特征的短文本分类[J]. 河北大学学报(自然科学版), 2014, 34(3): 307-311.
[4]	徐建民,刘清江,付婷婷,戴旭. 基于量化同义词关系的改进特征词提取方法[J]. 河北大学学报(自然科学版), 2010, 30(1): 97-101.
[5]	刘海博,郗亚辉,王煜. 用于文本分类的快速KNN算法[J]. 河北大学学报(自然科学版), 2008, 28(3): 322-326.
[6]	王煜,张明,马力. 基于词条聚合和决策树的文本分类方法[J]. 河北大学学报(自然科学版), 2005, 25(3): 338-342.
[7]	吴志峰,田学东. 人名、机构名在基于概念的文本分类中的应用研究[J]. 河北大学学报(自然科学版), 2004, 24(6): 657-661.
[8]	湛燕,陈昊,袁方,王丽娟. 文本挖掘研究进展[J]. 河北大学学报(自然科学版), 2003, 23(2): 221-226.

一种改进的朴素贝叶斯文本分类方法

An Improving Text Categorization Method of Na(i)ve Bayes

PDF (PC)

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 8

编辑推荐

Metrics

本文评价