分类导航

HTML 发布时间：2022-04-14 发布网站：大佬教程 code.js-code.com

大佬教程收集整理的这篇文章主要介绍了html – 使用XmlSlurper：如何在迭代GPathResult时选择子元素，大佬教程大佬觉得挺不错的，现在分享给大家，也给大家做个参考。

我正在编写一个 HTML解析器,它使用TagSoup将格式良好的结构传递给 XMLSlurper.

这是通用代码：

def htmlText = """
<html>
<body>
<div id="divId" class="divclass">
<h2>Heading 2</h2>
<ol>
<li><h3><a class="box" href="#href1">href1 link text</a> <span>extra stuff</span></h3><address>Here is the address<span>Telephone number: <strong>telephone</strong></span></address></li>
<li><h3><a class="box" href="#href2">href2 link text</a> <span>extra stuff</span></h3><address>Here is another address<span>Another telephone: <strong>0845 1111111</strong></span></address></li>
</ol>
</div>
</body>
</html>
"""     

def html = new XmlSlurper(new org.ccil.cowan.tagsoup.Parser()).parseText( htmlText );

html.'**'.grep { it.@class == 'divclass' }.ol.li.each { linkItem ->
    def link = linkItem.h3.a.@href
    def address = linkItem.address.text()
    println "$link: $address\n"
}

我希望每个人都允许我依次选择每个’li’,这样我就可以检索相应的href和地址细节.相反,我得到这个输出：

#href1#href2: Here is the addressTelephone number: telephoneHere is another addressAnother telephone: 0845 1111111

我已经在网上检查过各种各样的例子,这些例子要么处理XML,要么就像“从这个文件中检索所有链接”这样的单行示例.似乎it.h3.a. @ href表达式正在收集文本中的所有href,即使我将它传递给父’li’节点.

你能让我知道吗：

>为什么我要显示输出
>我如何检索每个’li’项目的href /地址对

谢谢.

解决方法

用find替换grep：

html.'**'.find { it.@class == 'divclass' }.ol.li.each { linkItem ->
    def link = linkItem.h3.a.@href
    def address = linkItem.address.text()
    println "$link: $address\n"
}

然后你会得到的

#href1: Here is the addressTelephone number: telephone

#href2: Here is another addressAnother telephone: 0845 1111111

grep返回一个ArrayList但find返回一个NodeChild类：

println html.'**'.grep { it.@class == 'divclass' }.getClass()
println html.'**'.find { it.@class == 'divclass' }.getClass()

结果是：

class java.util.ArrayList
class groovy.util.slurpersupport.NodeChild

因此,如果您想使用grep,那么您可以将其他每个像这样嵌套以使其工作

html.'**'.grep { it.@class == 'divclass' }.ol.li.each {
    it.each { linkItem ->
        def link = linkItem.h3.a.@href
        def address = linkItem.address.text()
        println "$link: $address\n"
    }
}

长话短说,在你的情况下,使用find而不是grep.

大佬总结

以上是大佬教程为你收集整理的html – 使用XmlSlurper：如何在迭代GPathResult时选择子元素全部内容，希望文章能够帮你解决html – 使用XmlSlurper：如何在迭代GPathResult时选择子元素所遇到的程序开发问题。

如果觉得大佬教程网站内容还不错，欢迎将大佬教程推荐给程序员好友。

本图文内容来源于网友网络收集整理提供，作为学习参考使用，版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ：384754419，请注明来意。

标签：

上一篇: 新固定大小窗口中的HTML Open Li... 下一篇:html – Chrome在低DPI和高DPI显...

猜你在找的HTML相关文章

html – 在不同的事件中CSS多重转换为相同的元素 2022-04-15
使用python绘制图形并使用HTML显示它 2019-10-08
使用JQuery很好地将DOM元素添加到DOM 2019-10-08
将值重新加载到数组中比javascript中的最后一个位置发生一个位置 2019-10-08
jquery – 在SELECT框中更改文本颜色 2019-10-08
Html表,使一行更大 2019-10-08
javascript – 使用Puppeteer,Mocha和Chai在html标记属性中断言文本的存在 2019-10-08
javascript – React：设置div的scrollTop属性不起作用 2019-10-08
html – 创建水平居中的背景图像渐变三角形 2019-10-08
javascript – 如何在Plyr JS的视频播放器中添加下载按钮？ 2019-10-08

其他相关热搜词更多

JavaScript之正则表达式学习笔记