河北大学学报(自然科学版) ›› 2005, Vol. 25 ›› Issue (2): 202-206.DOI: 10.3969/j.issn.1000-1565.2005.02.019

• • 上一篇    下一篇

Web日志挖掘中的数据预处理技术

侯亚丽,袁方   

  1. 河北大学,数学与计算机学院,河北,保定,071002
  • 出版日期:2005-01-25 发布日期:2005-01-25

Data Preparation for Web Log Mining

HOU Ya-li,YUAN Fang   

  • Online:2005-01-25 Published:2005-01-25

摘要: 用户访问网站,Web日志中会记录下大量的用户访问信息,通过挖掘这些日志数据可以获得相关页面、相似用户群体和用户访问模式等信息,Web日志挖掘对于优化网站结构、提供个性化服务和构建智能化网站具有重要作用.数据预处理是保证Web日志挖掘质量的重要基础,预处理主要包括数据清洗、用户识别、会话识别、路径补充和结果评价等工作.概述了数据预处理技术,重点介绍了目前常用的会话划分算法和评价标准,并实现了一个数据预处理系统.

关键词: Web日志挖掘, 数据预处理, 会话划分, 会话评价

中图分类号: