河北大学学报(自然科学版) ›› 2003, Vol. 23 ›› Issue (2): 221-226.DOI: 10.3969/j.issn.1000-1565.2003.02.026

• • 上一篇    

文本挖掘研究进展

湛燕,陈昊,袁方,王丽娟   

  1. 河北大学,数学与计算机科学学院,河北,保定,071002
  • 出版日期:2003-05-25 发布日期:2003-05-25
  • 基金资助:
    河北省教育厅科研项目

A Survey of Text Mining

  • Online:2003-05-25 Published:2003-05-25

摘要: 数据挖掘是将人工智能技术和数据库技术紧密结合,让计算机帮助人们从庞大的数据中智能地、自动地抽取出有价值的知识模式,以满足人们不同应用的需要.由于存储信息最多的自然形式就是文本,因此文本挖掘具有重要的意义.结合笔者研究工作,主要介绍了文本挖掘的研究内容,挖掘过程,挖掘算法及应用前景.

关键词: 文本挖掘, 特征选取, 文本分类, 文本聚类

中图分类号: