Php 如何从教科书回购网站获取临时信息?

Php 如何从教科书回购网站获取临时信息?,php,python,html,request,screen-scraping,Php,Python,Html,Request,Screen Scraping,我正在制作一个程序,其中一个部分是计算出教科书的最佳回购价格。我正在尝试从“”中获取值,例如,“”值为34$。问题是,该网站绝对不是静态的,简单的python抓取实际上不起作用。我该怎么办?什么要求?我不是一个非常有经验的网络工作,所以任何建议将不胜感激。最好的方法是,此页面使用Ajax获取一些附加信息。显示的源代码 函数fetchresults\u cb(搜索\u id,文本){ 替换内容(“价格结果”,文本); if(text.match(/completed/i)){ currentTi

我正在制作一个程序,其中一个部分是计算出教科书的最佳回购价格。我正在尝试从“”中获取值,例如,“”值为34$。问题是,该网站绝对不是静态的,简单的python抓取实际上不起作用。我该怎么办?什么要求?我不是一个非常有经验的网络工作,所以任何建议将不胜感激。最好的方法是,

此页面使用Ajax获取一些附加信息。显示的源代码


函数fetchresults\u cb(搜索\u id,文本){
替换内容(“价格结果”,文本);
if(text.match(/completed/i)){
currentTime=新日期();
time=currentTime.getTime();
delayfunc=“AjaxRetrieve('/ajax\u prices.php?type=PREFERRED&isbn=1285428226&search\u id=“+search\u id+”&ts=“+time+”,“fetchresults\u cb(\\\'”+search\u id+“\\”,THISREQ.responseText)、“true”);
设置超时(delayfunc,3000);
}
有一种不同的方法来解析这种页面

第一种方法是用Python重新实现上面的源代码,并像浏览器在JavaScript执行过程中那样获取额外的资源。您可以分析页面的完整源代码,或者在需要的信息可用的地方使用它来标识URL地址

第二种方法是使用Selenium,它使用浏览器引擎执行JavaScript,并提供包含所有必需信息的完整源代码


我相信您拥有bookscouter.com数据库所有者的权限来执行此类活动。

首先删除一个站点以获取信息是非常不可靠的,我建议查看一些API以获取所需信息。例如,如果您确实需要删除一个站点,selenium是python的一个好选择-
<script language="javascript" type="text/javascript">
    function fetchresults_cb(search_id, text) {
        replaceContent('price_results', text);
        if(text.match(/INCOMPLETE/i)) {
            currentTime = new Date();
            time = currentTime.getTime();
            delayfunc = "AjaxRetrieve('/ajax_prices.php?type=PREFERRED&isbn=1285428226&search_id="+search_id+"&ts="+time+"', 'fetchresults_cb(\\'"+search_id+"\\', THISREQ.responseText)', 'true');";
            setTimeout(delayfunc, 3000);
        }

</script>