大佬教程收集整理的这篇文章主要介绍了使用 Python 选择和重新排列 HTML 元素,大佬教程大佬觉得挺不错的,现在分享给大家,也给大家做个参考。
如何在不使用任何库的情况下结构化以下非结构化表格元素。
<table>
<tfoot>
<tr><td>Sum</td><td>$180</td></tr>
</tfoot>
<tbody>
<tr><td>January</td><td>$100</td></tr>
</tbody>
</table>
所需表:
<table>
<tbody>
<tr><td>January</td><td>$100</td></tr>
</tbody>
<tfoot>
<tr><td>Sum</td><td>$180</td></tr>
</tfoot>
</table>
保持 HTML 元素的属性顺序很重要。我试过使用 Beautifulsoup。它改变了顺序。请提出任何解决此问题的pythonic方法,不需要使用beautifulsoup或lxml。
您可以通过 re
使用正则表达式:
import re
s = """
<table>
<tfoot>
<tr><td>Sum</td><td>$180</td></tr>
</tfoot>
<tbody>
<tr><td>January</td><td>$100</td></tr>
</tbody>
</table>
"""
new_s = re.sub('\<tfoot\>[\w\W]+\</tfoot\>|\<tbody\>[\w\W]+\</tbody\>','{}',s).format(*re.findall('\<tfoot\>[\w\W]+\</tfoot\>|\<tbody\>[\w\W]+\</tbody\>',s)[::-1])
输出:
<table>
<tbody>
<tr><td>January</td><td>$100</td></tr>
</tbody>
<tfoot>
<tr><td>Sum</td><td>$180</td></tr>
</tfoot>
</table>
以上是大佬教程为你收集整理的使用 Python 选择和重新排列 HTML 元素全部内容,希望文章能够帮你解决使用 Python 选择和重新排列 HTML 元素所遇到的程序开发问题。
如果觉得大佬教程网站内容还不错,欢迎将大佬教程推荐给程序员好友。
本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。