Python 更新时钟刮片_Python_R_Xpath_Web Scraping

Python 更新时钟刮片

python r xpath web-scraping

Python 更新时钟刮片,python,r,xpath,web-scraping,Python,R,Xpath,Web Scraping,我正试图从网站上搜集一些数据。我似乎无法在这个页面上抓取日期（时钟），因为（我认为）它是通过一个函数不断更新的，xpath似乎不起作用有关网页为：我试图刮取的元素的xpath是： //*[（@id=“clock”）] 我试图在R和Python中实现这一点，但两者都不起作用。如果你对如何获取这些数据有什么建议，我将永远感激谢谢。（我将发布我在R中使用的代码，我知道它是有效的，因为其余的数据都被很好地刮取了） url=”http://www.tariffa.it/adsl/infostrada

我正试图从网站上搜集一些数据。我似乎无法在这个页面上抓取日期（时钟），因为（我认为）它是通过一个函数不断更新的，xpath似乎不起作用

有关网页为：我试图刮取的元素的xpath是： //*[（@id=“clock”）]

我试图在R和Python中实现这一点，但两者都不起作用。如果你对如何获取这些数据有什么建议，我将永远感激

谢谢。（我将发布我在R中使用的代码，我知道它是有效的，因为其余的数据都被很好地刮取了）

url=”http://www.tariffa.it/adsl/infostrada-easy-internet/"
doc1您是否尝试过使用//span[@id='clock']
？只是尝试过，没有运气。。。返回的输出（一如既往）是：“我认为您必须使用另一个库，例如：。如果您查看doc1
的输出，您将看到html不包含时间值，这些值实际上来自$（“#时钟”）。倒计时。。。
url = "http://www.tariffa.it/adsl/infostrada-easy-internet/"
doc1 <- htmlParse(url)
exp_date <- xpathSApply(doc1, '//*[(@id = "clock")]', saveXML)