木偶人获取所有数据属性值
我的html文档
<div class="inner-column">
<div data-thing="abc1"></div>
<div data-thing="abc2"></div>
<div data-thing="abc3"></div>
</div>
如何获取所有"数据-事物"值(例如,["ABC1","ABC2","ABC3"])在类为.Internal-column的div中?
const puppeteer = require('puppeteer');
const fs = require('fs');
(async () => {
const browser = await puppeteer.launch();
const page = await browser.newPage();
page.setViewport({width: 1440, height: 1200})
await page.goto('https://www.example.com')
const data = await page.content();
await browser.close();
})();
解决方案
您可以使用page.$$eval函数进行如下操作:
const dataValues = await page.$$eval(
'.inner-column div',
divs => divs.map(div => div.dataset.thing)
);
说明
page.$$eval
函数的作用(引用上面链接的文档):
此方法在页面内运行
Array.from(document.querySelectorAll(selector))
,并将其作为第一个参数传递给pageFunction
。如果
pageFunction
返回承诺,则page.$$eval
将等待承诺解析并返回其值。
因此,它将首先查询目标div,然后使用dataset属性将div映射到它们的data-*
值。
相关文章