2.1 正则表达式简介  正则表达式[7] 是一种可以用于模式匹配和替换的强有力的工具,一个正则表达式 就是由普通的字符(例如字符 a到z)以及特殊字符(称为元字符)组成的文字模式, 它描述在查找文字主体时待匹配的一个或多个字符串。正则表达式作为一个模板, 将某个字符模式与所搜索的字符串进行匹配。  正则表达式在字符数据处理中起着非常重要的作用,我们可以用正则表达式完 成大部分的数据分析处理工作,如: 判断一个串是否是数字、是否是有效的  Email  地 址,从海量的文字资料中提取有价值的数据等等,如果不使用正则表达式,那么实 现的程序可能会很长,并且容易出错。对这点本人深有体会,面对大量工具书电子 档资料的整理工作,如果不懂得应用正则表达式来处理,那么将花费很大的时间, 反之则将可以轻松地完成,获得事半功倍的效果。 
2.2 HTMLParser 概述  HTMLParser [8] 是一个开源的Java库,它提供接口,支持线性和嵌套的解析HTML 文本,HTMLParser Libraries 提供了一系列访问本地和网络 HTML 资源的 API。 Htmlparser.jar 提供底层的接口,它负责访问 HTML 中的文本、注释、标签等节点, 并把它们转换成线性的节点。HTMLParser 提供了两种访问节点的方法:Filter 模式 和Visitor 模式。 

上一篇:电子商务网站分类使用中的学习现象研究
下一篇:基于UML的某社团网站系统的建模与设计

《信息技术课程标准》微课的设计与制作

《信息技术课程标准》系列微课的设计与制作

C#员工信息管理系统设计

基于android的环境信息管理系统设计

ASP.NET飞翔租贷汽车公司信...

Android员工请假系统设计

高校校园网信息安全隐患及防范措施

新疆农林高校學生昆虫生...

淮安市高校足球运动损伤问卷调查表

2021年什么行业赚钱,适合...

大淘宝网的虚假交易研究

浅谈农村大气环境保护的制度构建【1868字】

发酵米粉优势菌株的发酵特性研究

肢体语言在小学英语教学中的应用浅谈

日语论文中日酒文化对比研究

个案管理茬老年糖尿病患...

激光模拟训练器材国内外研究现状