解析HTML用哪个更好

2024-11-06 14:25:19
推荐回答(2个)
回答(1):

多数情况下性能应该HtmlAgilityPack好些,HtmlAgilityPack的话碰到太大的网页也比较快的,它生成Dom节点树的算法效率估计要比正则高很多,主要是没什么回溯。得到Dom节点树后,基本都是对树的遍历和操作,效率是比较高的。但是正则也非常有用。

正则测试推荐Convert.Net这个工具,里面包含很多实用功能,如html、url编码解码、正则测试、vb同c#互转、谷歌翻译、xml和json解析、加密解密等。

回答(2):

  多数情况下性能应该HtmlAgilityPack好些,对于大网页,可以先用普通的字符串方法截取所需的元素块区域做为html文档,再施用这个东西,效率应该不错。
正则测试推荐Convert.Net这个工具,里面包含很多实用功能,如html、url编码解码、正则测试、vb同c#互转、谷歌翻译、xml和json解析、加密解密等。