HTML   发布时间:2022-04-14  发布网站:大佬教程  code.js-code.com
大佬教程收集整理的这篇文章主要介绍了如何使用scrapy Selector获取节点的innerHTML?大佬教程大佬觉得挺不错的,现在分享给大家,也给大家做个参考。

假设有一些html片段,如:

其中我想在标签中提取文本但在保留文本时排除这些标签,例如,我想要在上面提取的内容就像“c中b文本中的文本”和“b中文本中的文本” text inc“.现在我可以使用scrapy SELEctor css()函数获取节点,那么我怎么能继续这些节点来获得我想要的呢?任何想法将不胜感激,谢谢!

最佳答案
这是我设法做的:

from scrapy.SELEctor import SELEctor

sel = SELEctor(text = html_String)

for node in sel.css('a *::text'):
    print node.extract()

假设html_String是一个在你的问题中持有html的变量,这段代码产生以下输出:

   text in a

text in b


text in c




text in b

   text in a

text in c

选择器a * :: text()匹配作为节点后代的所有文本节点.

大佬总结

以上是大佬教程为你收集整理的如何使用scrapy Selector获取节点的innerHTML?全部内容,希望文章能够帮你解决如何使用scrapy Selector获取节点的innerHTML?所遇到的程序开发问题。

如果觉得大佬教程网站内容还不错,欢迎将大佬教程推荐给程序员好友。

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。