大佬教程收集整理的这篇文章主要介绍了puppeteer的简单使用_爬取页面信息,大佬教程大佬觉得挺不错的,现在分享给大家,也给大家做个参考。
registry=https://registry.npm.taobao.org chromedriver_cdnurl=http://npm.taobao.org/mirrors/chromedriver phantomjs_cdnurl=https://npm.taobao.org/dist/phantomjs electron_mirror=https://npm.taobao.org/mirrors/electron/ sass_binary_site=https://npm.taobao.org/mirrors/node-sass/ puppeteer_download_host=https://cdn.npm.taobao.org/dist
const puppeteer = require('puppeteer'); (async () => { // 创建一个浏览器实例 Browser 对象 const browser = await puppeteer.launch(); // 通过浏览器实例 Browser 对象创建页面 Page 对象 const page = await browser.newPage(); // 通过url参数打开指定的页面 await page.goto('https://example.com'); // 对页面进行截图 await page.screenshot({path: 'example.png'}); // 关闭浏览器 await browser.close(); })();
const puppeteer = require('puppeteer'); (async ()=>{ try{ // 创建一个浏览器实例 Browser 对象 let browser = await puppeteer.launch({ // 是否不显示浏览器, 为true则不显示 'headless': false,}); // 通过浏览器实例 Browser 对象创建页面 Page 对象 let page = await browser.newPage(); // 设置浏览器信息 const UA = "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML,like Gecko) Ubuntu Chromium/63.0.3239.84 Chrome/63.0.3239.84 Safari/537.36"; await Promise.all([ page.setUserAgent(UA),// 允许运行js page.setJavaScriptEnabled(true),// 设置页面视口的大小 page.setViewport({width: 1100,height: 1080}),]); // 地址 let chapter_list_url = `http://book.km.com/chapterlist/396353.html` // 打开章节列表 await page.goto(chapter_list_url); // 使用css选择器的方式 let content= await page.$eval('#xtopjsinfo > div.wrapper > div.container > div.catalog > div.catalog_bd',el => el.innerText); console.log(content); }catch(err){ console.log(err) } })()
以上是大佬教程为你收集整理的puppeteer的简单使用_爬取页面信息全部内容,希望文章能够帮你解决puppeteer的简单使用_爬取页面信息所遇到的程序开发问题。
如果觉得大佬教程网站内容还不错,欢迎将大佬教程推荐给程序员好友。
本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。