强制Instagram配置文件页面';要使用JavaScript远程加载的源代码
我正在为Instagram用户创建一个基于web的实时总计。由于Instagram不提供通过其API获取Instagram配置文件中喜欢的总数的功能,因此我通过检索html源代码并从中提取我需要的数据,从目标用户配置文件页面中删除喜欢的计数。(). 这一切都很好,但是源代码中只有12篇文章被加载,因为你必须向下滚动才能加载更多的文章(你可以通过转到并向下滚动更好地理解我的意思。在显示更多文章之前,你会看到它很快被加载)。我的目标是能够加载所有帖子,然后从源文件中提取我需要的数据 加载的帖子数量是不可预测的。对于已验证的用户,它似乎加载了24条帖子,而未验证的用户加载了12条,这对我来说没有多大意义。我查看了Instagram的html源文件,但似乎没有任何简单的方法可以加载其他帖子,而不必亲自在浏览器中加载。(但这行不通,因为我希望通过代码远程完成这一切) 要加载源文件,我使用以下代码:强制Instagram配置文件页面';要使用JavaScript远程加载的源代码,javascript,jquery,html,Javascript,Jquery,Html,我正在为Instagram用户创建一个基于web的实时总计。由于Instagram不提供通过其API获取Instagram配置文件中喜欢的总数的功能,因此我通过检索html源代码并从中提取我需要的数据,从目标用户配置文件页面中删除喜欢的计数。(). 这一切都很好,但是源代码中只有12篇文章被加载,因为你必须向下滚动才能加载更多的文章(你可以通过转到并向下滚动更好地理解我的意思。在显示更多文章之前,你会看到它很快被加载)。我的目标是能够加载所有帖子,然后从源文件中提取我需要的数据 加载的帖子数量是
var name = "selenagomez";
var url = "http://instagram.com/" + name;
$.get(url, function(response) {
... regex ...
}
在来源中,Instagram在帖子上附加了类似的计数,如下表所示:
“:{count':1234}
在检索到源代码后,我将使用正则表达式除去所有内容,但这些边是由“:{count':1234}的数字生成的。然后将数字放入如下数组:
[1, 2, 3, 4, 5 etc, etc]
之后,将数组添加到一起,以获得喜欢的总数并显示在网页上。所有这些代码都运行良好
最终,我只是想看看如何强制Instagram配置文件页面远程加载所有帖子,以便从源代码中提取类似的计数
提前感谢您对此提供的帮助。我找到了另一种方法,即利用为分页提供的结束游标值 对于任何想知道检索post JSON的链接的人,如下所示: {“id”:“PROFILE id”,“first”:“INT”,“after”:“END_CURSOR”} 其中,配置文件ID是配置文件的数字ID,可以从另一个JSON链接检索:用户名?\u a=1 INT是要获取的帖子数量。它可以是每个请求1到50之间的任意值 超过50的诀窍是在下一个链接中添加提供的END_光标字符串,这将前进到下一页的帖子,在那里您可以获得另一个50 注意事项:
- 如果您仅从用户处获得最近的1-50篇文章,则不必在链接中提供结束光标值。只有当您希望获取超过50篇最新文章时,结束光标才真正有用
- 到目前为止,查询散列是静态的,可以保留在42323D648861224307BE10013AD2DCC44