Javascript 使用PhantomJS从python3中的任何网站(在.js文件中的注释)提取注释

Javascript 使用PhantomJS从python3中的任何网站(在.js文件中的注释)提取注释,javascript,python,phantomjs,Javascript,Python,Phantomjs,我想从链接(WebCrawler)中提取评论。 此代码来自链接(Ctrl+u) !函数(t,e,n){函数a(t){var a=e.createElement(“脚本”);a.type=“text/javascript”,a.async=!0,a.src=”(“https:==e.location.protocol?”https:“http”)+:“+n,(t | e.body | e.head)。appendChild(a)}函数o(){var t=e.getElementsByTagNam

我想从链接(WebCrawler)中提取评论。 此代码来自链接(Ctrl+u)


!函数(t,e,n){函数a(t){var a=e.createElement(“脚本”);a.type=“text/javascript”,a.async=!0,a.src=”(“https:==e.location.protocol?”https:“http”)+:“+n,(t | e.body | e.head)。appendChild(a)}函数o(){var t=e.getElementsByTagName(“脚本”),n=t[t.length-1];return n.parentNode}var p=o();t | spotId=spotChild=e.phyTagname(脚本),parenta)}(window.SPOTIM={},文档,“//www.spot.im/launcher/bundle.js”);
我可以进入
bundle.js
提取注释吗


我读过关于phantomJs的文章。我能用python中的phantomJs从任何javascript文件中刮取注释吗?(如上代码所示。
bundle.js
)。如果是!怎么做?有没有打开
.js
文件的例子?

,因为所有注释都绑定到类消息实体。我会让爬虫为该类的每个元素提取html。将phantomJS与python结合使用的最简单方法是通过Selenium或Ghostdriver。如果你不坚持使用python,那么我建议使用一些东西ng喜欢node horseman或casperjs在网站上爬行并获取评论。

你能告诉我一些通过casperjs或node horseman提取评论的例子吗?
var horseman=require(“node horseman”);var horseman=new horseman();horseman.open('http://lite.yelp.com/search?find_desc=pizza&find_loc=94040&find_submit=Search“).text('address').log().close();
如何使用上述任何库打开任何
.js
文件?这些是无头浏览器。这意味着它们将导航到您在.open()中指定的任何站点方法。然后,由于它位于节点环境中,您可以使用
node which.js
从终端触发它。这是否回答了您的问题?正如我在回答中所说,这样做的方法是使用爬虫来抓取站点,有很多爬虫可以完成这项工作,您只需要选择一个您喜欢的。抓取的概念是您使用无头浏览器并从呈现的页面提取数据。您没有从源代码中挖掘数据。有很多示例听起来是您可以使用的好资源。什么是注释?您是指页面上的注释还是页面代码中的注释?您自己尝试过什么吗?堆栈溢出不是问题这不是一个代码编写服务,是的,这是可能的。哦,我的天哪!什么是该死的行为!@ArtjomB。如果你给新手冷淡的行为就好了。很抱歉,如果这有点苛刻,但用户应该描述你遇到的问题,让别人为你写一个完整的脚本不是问题,而是问题任务。如果你做不到,请雇佣一名开发人员。如果你不想,那么你应该开始学习该语言并做一些教程。周围有很多。而且,你还没有回答我的问题,所以你的问题对我来说仍然不清楚。我否决了它,因为这对于这个网站来说现在不是一个好问题,应该删除。如果你有你的问题为了更好,我将取消我的否决票。
 <div class="spot-im-frame-inpage" data-post-id="353493"></div><script type="text/javascript">
!function(t,e,n){function a(t){var a=e.createElement("script");a.type="text/javascript",a.async=!0,a.src=("https:"===e.location.protocol?"https":"http")+":"+n,(t||e.body||e.head).appendChild(a)}function o(){var t=e.getElementsByTagName("script"),n=t[t.length-1];return n.parentNode} var p=o();t.spotId="sp_6phY2k0C",t.parentElement=p,a(p)}(window.SPOTIM={},document,"//www.spot.im/launcher/bundle.js");