大佬教程收集整理的这篇文章主要介绍了Ruby 提取 HTML 文档中的链接和图片,大佬教程大佬觉得挺不错的,现在分享给大家,也给大家做个参考。
require 'rexml/document' require 'rexml/streamlistener' require 'set' class LinkGrabber include REXML::StreamListener attr_reader :links def initialize(interesTing_tags = {'a' => %w{href},'img' => %w{src}}.freezE) @tags = interesTing_tags @links = Set.new end def tag_start(name,attrs) @tags[name].each do |uri_attr| @links << attrs[uri_attr] if attrs[uri_attr] end if @tags[name] end def parse(text) REXML::Document.parse_stream(text,self) end end text = %{"test <a href="http://www.example.com/">http://www.example.com/</a>,http://www.example.com/blog/. Email me at <a href="mailto:[email protected]">[email protected]</a>.} grabber = LinkGrabber.new grabber.parse(text) p grabber.links
以上是大佬教程为你收集整理的Ruby 提取 HTML 文档中的链接和图片全部内容,希望文章能够帮你解决Ruby 提取 HTML 文档中的链接和图片所遇到的程序开发问题。
如果觉得大佬教程网站内容还不错,欢迎将大佬教程推荐给程序员好友。
本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。