Javascript 从reddit URL获取原始URL

Javascript 从reddit URL获取原始URL,javascript,node.js,reddit,Javascript,Node.js,Reddit,考虑这一联系: https://www.reddit.com/r/todayilearned/comments/6x6iz8/til_princess_diana_on_live_tv_shook_the_hand_of/?ref=share&ref_source=link 原来是这样的 http://www.bbc.com/news/av/magazine-39490507/how-princess-diana-changed-attitudes-to-aids 使用Javascript,我如

考虑这一联系:
https://www.reddit.com/r/todayilearned/comments/6x6iz8/til_princess_diana_on_live_tv_shook_the_hand_of/?ref=share&ref_source=link

原来是这样的

http://www.bbc.com/news/av/magazine-39490507/how-princess-diana-changed-attitudes-to-aids


使用Javascript,我如何在不使用Reddit API的情况下从第一个链接访问原始链接?

如果你说的是在网页中运行的Javascript,你不能。您需要使用RedditAPI,或者删除Reddit网页。但是,由于跨源安全规则,您无法使用JavaScript刮取网页,因此必须使用API


编辑:啊,保罗刚刚指出你标记了Node.js;如果您在服务器上执行此操作,则可以进行刮取。查找“使用node.js进行刮取”。粗略浏览一下谷歌,大多数解决方案似乎都涉及下载Reddit网页的HTML,然后使用一个名为cheerio的库对其进行解析。还有一件事情看起来很有希望。

是的,浏览页面并获取链接,为您提供不同的视角或更正您的问题。您提供的链接确实以任何方式指向bbc.com链接。恰好您的原始链接指向的页面包含该链接。所以,唯一的办法就是从页面上刮取该链接。@保罗:当你试图在Reddit上共享帖子时(通过单击“共享”按钮),会得到这种格式(而不是原始链接)@Ari,正确。本质上,当你点击“共享”时,他们会给你一个网页,恰好有一个指向原始文章的链接。如前所述,web抓取可能是您唯一的选择。他标记了node.js,所以我们可以假设它是服务器端而不是客户端。