大佬教程收集整理的这篇文章主要介绍了使用beautifulsoup查找下一个同胞,直到某个同胞,大佬教程大佬觉得挺不错的,现在分享给大家,也给大家做个参考。
我认为您可以执行以下操作:
for section in soup.findAll('h2'):
nextNode = section
while True:
nextNode = nextNode.nextSibling
try:
tag_name = nextNode.name
except AttributeError:
tag_name = ""
if tag_name == "p":
print nextNode.String
else:
print "*****"
break
鉴于:
<h2>section1</h2>
<p>article1</p>
<p>article2</p>
<p>article3</p>
<h2>section2</h2>
<p>article4</p>
<p>article5</p>
<p>article6</p>
输出:
article1
article2
article3
*****
article4
article5
article6
*****
该网页是这样的:
<h2>section1</h2>
<p>article</p>
<p>article</p>
<p>article</p>
<h2>section2</h2>
<p>article</p>
<p>article</p>
<p>article</p>
如何找到@R_618_10498@文章的每个部分?也就是说,在找到h2之后,找到下一个兄弟姐妹
直到下一个h2。
如果网页类似于:(通常是这种情况)
<div>
<h2>section1</h2>
<p>article</p>
<p>article</p>
<p>article</p>
</div>
<div>
<h2>section2</h2>
<p>article</p>
<p>article</p>
<p>article</p>
</div>
我可以编写如下代码:
for section in soup.findAll('div'):
...
for post in section.findAll('p')
但是,如果我想获得相同的结果,该如何处理第一个网页?
以上是大佬教程为你收集整理的使用beautifulsoup查找下一个同胞,直到某个同胞全部内容,希望文章能够帮你解决使用beautifulsoup查找下一个同胞,直到某个同胞所遇到的程序开发问题。
如果觉得大佬教程网站内容还不错,欢迎将大佬教程推荐给程序员好友。
本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。