Python 更新时钟刮片

Python 更新时钟刮片,python,r,xpath,web-scraping,Python,R,Xpath,Web Scraping,我正试图从网站上搜集一些数据。我似乎无法在这个页面上抓取日期(时钟),因为(我认为)它是通过一个函数不断更新的,xpath似乎不起作用 有关网页为: 我试图刮取的元素的xpath是: //*[(@id=“clock”)] 我试图在R和Python中实现这一点,但两者都不起作用。如果你对如何获取这些数据有什么建议,我将永远感激 谢谢。(我将发布我在R中使用的代码,我知道它是有效的,因为其余的数据都被很好地刮取了) url=”http://www.tariffa.it/adsl/infostrada

我正试图从网站上搜集一些数据。我似乎无法在这个页面上抓取日期(时钟),因为(我认为)它是通过一个函数不断更新的,xpath似乎不起作用

有关网页为: 我试图刮取的元素的xpath是: //*[(@id=“clock”)]

我试图在R和Python中实现这一点,但两者都不起作用。如果你对如何获取这些数据有什么建议,我将永远感激

谢谢。(我将发布我在R中使用的代码,我知道它是有效的,因为其余的数据都被很好地刮取了)

url=”http://www.tariffa.it/adsl/infostrada-easy-internet/"

doc1您是否尝试过使用
//span[@id='clock']
?只是尝试过,没有运气。。。返回的输出(一如既往)是:“我认为您必须使用另一个库,例如:。如果您查看
doc1
的输出,您将看到html不包含时间值,这些值实际上来自
$(“#时钟”)。倒计时
。。。
url = "http://www.tariffa.it/adsl/infostrada-easy-internet/"
doc1 <- htmlParse(url)
exp_date <- xpathSApply(doc1, '//*[(@id = "clock")]', saveXML)