强制Instagram配置文件页面';要使用JavaScript远程加载的源代码

强制Instagram配置文件页面';要使用JavaScript远程加载的源代码,javascript,jquery,html,Javascript,Jquery,Html,我正在为Instagram用户创建一个基于web的实时总计。由于Instagram不提供通过其API获取Instagram配置文件中喜欢的总数的功能,因此我通过检索html源代码并从中提取我需要的数据,从目标用户配置文件页面中删除喜欢的计数。(). 这一切都很好,但是源代码中只有12篇文章被加载,因为你必须向下滚动才能加载更多的文章(你可以通过转到并向下滚动更好地理解我的意思。在显示更多文章之前,你会看到它很快被加载)。我的目标是能够加载所有帖子,然后从源文件中提取我需要的数据 加载的帖子数量是

我正在为Instagram用户创建一个基于web的实时总计。由于Instagram不提供通过其API获取Instagram配置文件中喜欢的总数的功能,因此我通过检索html源代码并从中提取我需要的数据,从目标用户配置文件页面中删除喜欢的计数。(). 这一切都很好,但是源代码中只有12篇文章被加载,因为你必须向下滚动才能加载更多的文章(你可以通过转到并向下滚动更好地理解我的意思。在显示更多文章之前,你会看到它很快被加载)。我的目标是能够加载所有帖子,然后从源文件中提取我需要的数据

加载的帖子数量是不可预测的。对于已验证的用户,它似乎加载了24条帖子,而未验证的用户加载了12条,这对我来说没有多大意义。我查看了Instagram的html源文件,但似乎没有任何简单的方法可以加载其他帖子,而不必亲自在浏览器中加载。(但这行不通,因为我希望通过代码远程完成这一切)

要加载源文件,我使用以下代码:

var name = "selenagomez";
var url = "http://instagram.com/" + name;

    $.get(url, function(response) {
        ... regex ...
     }
在来源中,Instagram在帖子上附加了类似的计数,如下表所示:

“:{count':1234} 在检索到源代码后,我将使用正则表达式除去所有内容,但这些边是由“:{count':1234}的数字生成的。然后将数字放入如下数组:

[1, 2, 3, 4, 5 etc, etc]
之后,将数组添加到一起,以获得喜欢的总数并显示在网页上。所有这些代码都运行良好

最终,我只是想看看如何强制Instagram配置文件页面远程加载所有帖子,以便从源代码中提取类似的计数


提前感谢您对此提供的帮助。

我找到了另一种方法,即利用为分页提供的结束游标值

对于任何想知道检索post JSON的链接的人,如下所示: {“id”:“PROFILE id”,“first”:“INT”,“after”:“END_CURSOR”}

其中,配置文件ID是配置文件的数字ID,可以从另一个JSON链接检索:用户名?\u a=1

INT是要获取的帖子数量。它可以是每个请求1到50之间的任意值

超过50的诀窍是在下一个链接中添加提供的END_光标字符串,这将前进到下一页的帖子,在那里您可以获得另一个50

注意事项:

  • 如果您仅从用户处获得最近的1-50篇文章,则不必在链接中提供结束光标值。只有当您希望获取超过50篇最新文章时,结束光标才真正有用

  • 到目前为止,查询散列是静态的,可以保留在42323D648861224307BE10013AD2DCC44


您可能需要研究无头浏览器才能实现这一点。我希望尽可能避免使用无头浏览器。你认为完全使用JavaScript就可以做到这一点吗?