河北大学学报(自然科学版) ›› 2005, Vol. 25 ›› Issue (3): 338-342.DOI: 10.3969/j.issn.1000-1565.2005.03.024

• • 上一篇    

基于词条聚合和决策树的文本分类方法

王煜1,张明1,马力2   

  1. 1.河北大学,数学与计算机学院,河北,保定,071002; 2.河北大学,出版社,河北,保定,071002
  • 出版日期:2005-01-25 发布日期:2005-01-25
  • 基金资助:
    河北省科学技术研究与发展计划

Text Categorization Based on Word Aggregation and Decision Tree

WANG Yu1,ZHANG Ming1,MA Li2   

  • Online:2005-01-25 Published:2005-01-25

摘要: 根据词条聚合和决策树原理,提出了一种文本分类的新方法.决策树分类方法具有出色的数据分析效率和容易抽取易于理解的分类规则等优势,但只能应用于维数较低的特征空间.本方法将与各个类别相关程度相似的词条聚合为一个特征,有效地降低了向量空间的维数,然后再使用决策树进行分类,从而既保证了分类精度又获得了决策树易于抽取分类规则的优势.

关键词: 文本分类, 互信息, 决策树

中图分类号: