Php 如何从教科书回购网站获取临时信息？_Php_Python_Html_Request_Screen Scraping

Php 如何从教科书回购网站获取临时信息？

php python html

Php 如何从教科书回购网站获取临时信息？,php,python,html,request,screen-scraping,Php,Python,Html,Request,Screen Scraping,我正在制作一个程序，其中一个部分是计算出教科书的最佳回购价格。我正在尝试从“”中获取值，例如，“”值为34$。问题是，该网站绝对不是静态的，简单的python抓取实际上不起作用。我该怎么办？什么要求？我不是一个非常有经验的网络工作，所以任何建议将不胜感激。最好的方法是，此页面使用Ajax获取一些附加信息。显示的源代码函数fetchresults\u cb（搜索\u id，文本）{ 替换内容（“价格结果”，文本）； if（text.match（/completed/i））{ currentTi

我正在制作一个程序，其中一个部分是计算出教科书的最佳回购价格。我正在尝试从“”中获取值，例如，“”值为34$。问题是，该网站绝对不是静态的，简单的python抓取实际上不起作用。我该怎么办？什么要求？我不是一个非常有经验的网络工作，所以任何建议将不胜感激。最好的方法是，

此页面使用Ajax获取一些附加信息。显示的源代码


函数fetchresults\u cb（搜索\u id，文本）{
替换内容（“价格结果”，文本）；
if（text.match（/completed/i））{
currentTime=新日期（）；
time=currentTime.getTime（）；
delayfunc=“AjaxRetrieve（'/ajax\u prices.php？type=PREFERRED&isbn=1285428226&search\u id=“+search\u id+”&ts=“+time+”，“fetchresults\u cb（\\\'”+search\u id+“\\”，THISREQ.responseText）、“true”）；
设置超时（delayfunc，3000）；
}

有一种不同的方法来解析这种页面

第一种方法是用Python重新实现上面的源代码，并像浏览器在JavaScript执行过程中那样获取额外的资源。您可以分析页面的完整源代码，或者在需要的信息可用的地方使用它来标识URL地址

第二种方法是使用Selenium，它使用浏览器引擎执行JavaScript，并提供包含所有必需信息的完整源代码

我相信您拥有bookscouter.com数据库所有者的权限来执行此类活动。

首先删除一个站点以获取信息是非常不可靠的，我建议查看一些API以获取所需信息。例如，如果您确实需要删除一个站点，selenium是python的一个好选择-

<script language="javascript" type="text/javascript">
    function fetchresults_cb(search_id, text) {
        replaceContent('price_results', text);
        if(text.match(/INCOMPLETE/i)) {
            currentTime = new Date();
            time = currentTime.getTime();
            delayfunc = "AjaxRetrieve('/ajax_prices.php?type=PREFERRED&isbn=1285428226&search_id="+search_id+"&ts="+time+"', 'fetchresults_cb(\\'"+search_id+"\\', THISREQ.responseText)', 'true');";
            setTimeout(delayfunc, 3000);
        }

</script>