如何使用TripAdvisor中的puppeter.js(node.js)获取动态Html标记的内部文本?

如何使用TripAdvisor中的puppeter.js(node.js)获取动态Html标记的内部文本?,html,node.js,chromium,puppeteer,Html,Node.js,Chromium,Puppeteer,我如何使用innerText属性通过循环或木偶演员函数获得此页面中的所有10条注释 我提出的唯一解决方案是获取整个评论容器的outerHTML,然后尝试使用子字符串获取所有评论,但这不是最优的,我认为这是一种更困难的方法。也许有一个更简单的解决办法在木偶戏我找不到 我这样做是为了教育目的。注释在class=partial_条目中,我想获得动态Html标记的内部文本,我想要全部10个,就像您在这里看到的: 如果我在哪里打开包含的div,我将得到另一个id=review582693262的div。说

我如何使用innerText属性通过循环或木偶演员函数获得此页面中的所有10条注释

我提出的唯一解决方案是获取整个评论容器的outerHTML,然后尝试使用子字符串获取所有评论,但这不是最优的,我认为这是一种更困难的方法。也许有一个更简单的解决办法在木偶戏我找不到

我这样做是为了教育目的。注释在class=partial_条目中,我想获得动态Html标记的内部文本,我想要全部10个,就像您在这里看到的:

如果我在哪里打开包含的div,我将得到另一个id=review582693262的div。说到这里,如果我找到一个class=partial_条目,这就是我的注释所在的位置。我尝试了一些方法,但得到了null,因为找不到它,因为每个注释的父项都有一个唯一的id,如id=review\uuxxxxxxxx


这有点困难,因为review id是自动生成的,比如id=review\uxxxxxxxx,并且不能通过复制CSS路径的循环进行迭代,因为我没有一个静态父对象。

为什么不选择那些具有部分输入类的元素呢?这项工作:

let comments = await page.evaluate(() =>
    [...document.querySelectorAll(".partial_entry")].map(item => item.textContent)
);

通配符css选择器可以工作吗?i、 e.[id*=review_uu]我今晚会试试这个,我认为它可能会奏效。我通过计算所有具有“partial_entry”的标记找到了解决问题的方法,但这更好,因为我特别需要在解决方案中使用类,如.partial_entry。谢谢。