Javascript 仅href="#&引用;,没有onclick(),如何在脚本中加载它?

Javascript 仅href="#&引用;,没有onclick(),如何在脚本中加载它?,javascript,html,web-scraping,web-crawler,href,Javascript,Html,Web Scraping,Web Crawler,Href,我正在为网站上的文章写一个刮刀。我还想包括这些评论。但是,加载页面时,并非所有注释都会自动加载。相反,你必须点击一个链接来加载更多的评论,直到在某个时候,所有的评论都被加载 例如: 向下滚动时,会出现一个表面“MEHR KOMMENTARE Anzigen”(德语中表示“显示更多评论”) 此链接看起来像: <div href="#" style="text-align: center; height: 44px; cursor: pointer;"> <a style="fon

我正在为网站上的文章写一个刮刀。我还想包括这些评论。但是,加载页面时,并非所有注释都会自动加载。相反,你必须点击一个链接来加载更多的评论,直到在某个时候,所有的评论都被加载

例如:

向下滚动时,会出现一个表面“MEHR KOMMENTARE Anzigen”(德语中表示“显示更多评论”)

此链接看起来像:

<div href="#" style="text-align: center; height: 44px; cursor: pointer;">
<a style="font-size: 0.6875rem; font-family: ffmark, &quot;Helvetica Neue&quot;, Helvetica, Arial, sans-serif; font-weight: 800; color: rgb(0, 57, 91); line-height: 5;">
<span style="font-size: 0.6875rem; font-family: ffmark, &quot;Helvetica Neue&quot;, Helvetica, Arial, sans-serif; font-weight: 500; margin-right: 0.625rem; text-align: right; color: rgb(120, 120, 120);">
MEHR KOMMENTARE ANZEIGEN
<span style="width: 14px; height: 8px; margin: 0px 0px 0px 0.625rem; padding-top: 0px; display: inline-block; vertical-align: initial;">
<svg viewBox="0 0 15 9" version="1.1" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink">
<g stroke="none" stroke-width="1" fill="none" fill-rule="evenodd">
<g transform="translate(-608.000000, -4318.000000)" fill="#787878">
<polygon transform="translate(615.205882, 4322.852941) rotate(-90.000000) translate(-615.205882, -4322.852941) " points="618.264706 4315.79412 611.205882 4322.85353 618.264706 4329.91176 619.205882 4328.97059 613.088824 4322.85353 619.205882 4316.73529">
</polygon>
</g>
</g>
</svg>
</span>
</span>
</a>
</div>

梅尔科门塔雷酒店
但是,我不知道如何在脚本中加载此链接

我知道当javascript处理链接时会使用
href=“#”
,这是一种糟糕的风格,因为它只用于更改鼠标的外观,还有其他方法


但是onClick()方法在哪里?这里有点傻…

点击两次“显示评论”会得到以下URL

https://api-co.la.welt.de/api/comments?document-id=183878020&created-cursor=2018-11-15T13:52:41.714&sort=NEWEST
https://api-co.la.welt.de/api/comments?document-id=183878020&created-cursor=2018-11-15T12:23:26.896&sort=NEWEST
返回注释。所以,只需使用您拥有的帖子id,并不断摆弄创建的光标,直到您得到所有的评论

编辑: 删除creator cursor参数会给出所有注释

https://api-co.la.welt.de/api/comments?document-id=183878020
编辑2:

正如其他人所提到的,如果不先联系网站所有者,这可能不是一个好主意。

至于找到点击处理程序: 如果检查此元素,可以看到它有一个单击事件处理程序,调用communityweb.js中的某些内容:

这几乎可以肯定是在其他地方(例如,
document.getElementById('something').addEventListener(“click”,function(){…});

如果需要,您可以查看它调用的代码(请确保使用“漂亮打印”功能,因为它已经缩小):


这会变得很复杂,但是如果你有足够的决心,你可以在调试器中单步执行,看看调用了什么。

如果没有
onclick
,那么我猜页面加载的JavaScript中某个地方注册了一个点击处理程序。知道页面使用什么JavaScript框架(如果有的话)吗?这些页面加载了20个不同的脚本文件。所有事件处理程序都会在某个地方。但是正如下面的elken所示,如果您能够提取所有相关的API端点,那么使用这些端点将比实际删除站点要好得多。但要注意版权,我不确定他们是否会介意。当涉及到网页抓取时,我个人建议使用,例如,因为您可以通过编程方式单击元素,而无需嗅探事件侦听器。您还可以在继续之前等待DOM更改或发出网络请求。所有这些听起来都会让您的用例受益。你不能用内容脚本来实现这一点。我猜你用的就是这个?