沈洁;薛贵荣
随着 HTML格式的出现 ,Internet得到了迅猛发展 ,面对着浩瀚如烟的数据 ,为了从中发现潜在的、有价值的信息 ,必须对 Web信息进行挖掘 ,但由于 HTML语言特点 ,使得 Web信息的组织结构性很差 ,对于进行 Web数据挖掘工作有很大的阻碍 ,XML语言的出现从根本上解决了这个问题 ,XML语言具有良好的结构 ,层次性好 ,用其对 Web页面信息进行组织 ,有利于进行数据挖掘工作 .本文通过对XML语言的认识提出了一个基于 XML的 Web Miner模型 ,以帮助用户快速、有效的挖掘 Web上的信息.