大佬教程收集整理的这篇文章主要介绍了perl爬虫收集当前页面所以链接地址,不需要用HTML::LinkExtor模块,大佬教程大佬觉得挺不错的,现在分享给大家,也给大家做个参考。
use LWP::Simple; use URI::URL; my @collect_url=(); my $url = "http://pngu.mgh.harvard.edu/~purcell/plink/anal.shtml#model"; my $html = get( $url ); $base= "http://pngu.mgh.harvard.edu/~purcell/plink/"; while ($html =~ m/\"(.*?)\"/ig)#匹配的只是相对地址,需要用绝对地址来修改才能下载 { my $new_url = url($1,$basE)->abs; push @collect_url,$new_url; } print join("\n",@collect_url),"\n";
以上是大佬教程为你收集整理的perl爬虫收集当前页面所以链接地址,不需要用HTML::LinkExtor模块全部内容,希望文章能够帮你解决perl爬虫收集当前页面所以链接地址,不需要用HTML::LinkExtor模块所遇到的程序开发问题。
如果觉得大佬教程网站内容还不错,欢迎将大佬教程推荐给程序员好友。
本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。