程序问答   发布时间:2022-06-02  发布网站:大佬教程  code.js-code.com
大佬教程收集整理的这篇文章主要介绍了Beautiful Soup 4 find_all找不到Beautiful Soup 3找到的链接大佬教程大佬觉得挺不错的,现在分享给大家,也给大家做个参考。

如何解决Beautiful Soup 4 find_all找不到Beautiful Soup 3找到的链接?

开发过程中遇到Beautiful Soup 4 find_all找不到Beautiful Soup 3找到的链接的问题如何解决?下面主要结合日常开发的经验,给出你关于Beautiful Soup 4 find_all找不到Beautiful Soup 3找到的链接的解决方法建议,希望对你解决Beautiful Soup 4 find_all找不到Beautiful Soup 3找到的链接有所启发或帮助;

您已经lxml安装了,这意味着BeautifulSoup 4将在标准库选项上使用 解析器HTMl.parser

您可以将lxml升级到3.2.1(对我来说,这将为您的测试页返回1701个结果);lxml本身会使用libxml2libxslt在这里也可能要怪。您可能还必须升级这些 。请参阅lxml要求页面;当前建议使用libxml2 2.7.8或更高版本。

或在解析汤时明确指定其他解析器:

s4 = bs4.beautifulSoup(r.text, 'HTMl.parser')

解决方法

我注意到一个非常烦人的错误:BeautifulSoup4(程序包:)bs4经常发现的标签少于以前的版本(程序包:)BeautifulSoup

这是该问题的可复制实例:

import requests
import bs4
import BeautifulSoup

r = requests.get('http://wordpress.org/download/release-archive/')
s4 = bs4.beautifulSoup(r.text)
s3 = BeautifulSoup.beautifulSoup(r.text)

print 'With BeautifulSoup 4 : {}'.format(len(s4.findAll('a')))
print 'With BeautifulSoup 3 : {}'.format(len(s3.findAll('a')))

输出:

With BeautifulSoup 4 : 557
With BeautifulSoup 3 : 1701

如您所见,差异并不小。

如果有人怀疑,以下是模块的确切版本:

In [20]: bs4.__version__
Out[20]: '4.2.1'

In [21]: BeautifulSoup.__version__
Out[21]: '3.2.1'

大佬总结

以上是大佬教程为你收集整理的Beautiful Soup 4 find_all找不到Beautiful Soup 3找到的链接全部内容,希望文章能够帮你解决Beautiful Soup 4 find_all找不到Beautiful Soup 3找到的链接所遇到的程序开发问题。

如果觉得大佬教程网站内容还不错,欢迎将大佬教程推荐给程序员好友。

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。