河北大学学报(自然科学版) ›› 2007, Vol. 27 ›› Issue (2): 209-212.DOI: 10.3969/j.issn.1000-1565.2007.02.025

• • 上一篇    下一篇

基于 DOM 的 Web 信息抽取规则的构造与实现

杨敬伟1,杨文柱2,高悦3   

  1. 1.河北大学,科技处,河北,保定,071002; 2.河北大学,数学与计算机学院,河北,保定,071002; 3.信息产业部,电信研究院,北京,100037
  • 出版日期:2007-03-25 发布日期:2007-03-25

Rules Construction and Implementation in DOM-based Web Information Extraction

YANG Jing-wei1,YANG Wen-zhu2,GAO Yue3   

  • Online:2007-03-25 Published:2007-03-25

摘要: 为了实现对Web信息的查询重、构和再利用,人们采用了Web信息抽取技术.本文主要讨论基于 DOM 的 Web 信息抽取,研究如何构造抽取规则,才能提高信息抽取的准确度、提高抽取规则的适应能力,并给出了抽取规则的生成过程.

关键词: DOM, Web信息抽取, 抽取规则

中图分类号: