程序问答   发布时间:2022-06-02  发布网站:大佬教程  code.js-code.com
大佬教程收集整理的这篇文章主要介绍了哪种 HTML 解析器是最好的?大佬教程大佬觉得挺不错的,现在分享给大家,也给大家做个参考。

如何解决哪种 HTML 解析器是最好的??

开发过程中遇到哪种 HTML 解析器是最好的?的问题如何解决?下面主要结合日常开发的经验,给出你关于哪种 HTML 解析器是最好的?的解决方法建议,希望对你解决哪种 HTML 解析器是最好的?有所启发或帮助;

自我插件:我刚刚发布了一个新的Java HTML解析器:Jsoup。我在这里提到它是因为我认为它会做您所追求的。

它的技巧是使用css选择器语法来查找元素,例如:

String HTML = "<HTML><head><title>First parse</title></head>"
  + "<body><p>Parsed HTML into a doc.</p></body></HTML>";
document doc = Jsoup.parse(HTML);
Elements links = doc.SELEct("a");
Element head = doc.SELEct("head").first();
@H_674_9@

有关更多信息,请参见SELEctor javadoc。

这是一个新项目,因此任何改进的想法都非常欢迎!

解决方法

我编写了很多解析器。到目前为止,我一直使用HtmlUnit无头浏览器进行解析和浏览器自动化。

现在,我想将两个任务分开。

由于我80%的工作仅涉及解析,因此我想使用简单的HTML解析器,因为在HtmlUnit中花费大量时间先加载页面,然后获取源然后解析它。

我想知道哪个HTML解析器是最好的。如果解析器与HtmlUnit解析器接近,则解析器会更好。

编辑:

最好的情况是,我至少需要以下功能:

速度
易于通过其“ id”或“ name”或“ tag type”定位任何HtmlElement。
如果不清除脏HTML代码,对我来说可以。我不需要清理任何HTML源。我只需要一种最简单的方法即可在HtmlElements之间移动并从中获取数据。

大佬总结

以上是大佬教程为你收集整理的哪种 HTML 解析器是最好的?全部内容,希望文章能够帮你解决哪种 HTML 解析器是最好的?所遇到的程序开发问题。

如果觉得大佬教程网站内容还不错,欢迎将大佬教程推荐给程序员好友。

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。