Web scraping 为什么ImportXML在尝试清理kickstarter.com时不适用于特定字段?
我试图筛选特定Kickstarter项目的勉强资助状态。 我在我的谷歌电子表格中使用以下公式,我在这里尝试的是获得项目资金状态的美元金额:Web scraping 为什么ImportXML在尝试清理kickstarter.com时不适用于特定字段?,web-scraping,screen-scraping,google-sheets,Web Scraping,Screen Scraping,Google Sheets,我试图筛选特定Kickstarter项目的勉强资助状态。 我在我的谷歌电子表格中使用以下公式,我在这里尝试的是获得项目资金状态的美元金额: =ImportXML("http://www.kickstarter.com/projects/1904431672/trsst-a-distributed-secure-blog-platform-for-the-o","//data[@class='Project942741362']") 它在单元格中返回#N/A,并带有注释: 错误:xPath查询未
=ImportXML("http://www.kickstarter.com/projects/1904431672/trsst-a-distributed-secure-blog-platform-for-the-o","//data[@class='Project942741362']")
它在单元格中返回#N/A,并带有注释:
错误:xPath查询未返回任何数据
当我尝试在同一网页的其他部分使用ImportXML时,它似乎工作得非常好。有人能指出我在这里做错了什么吗?标签“数据”似乎没有正确解析
解决方案的选择可能是:
=REGEXEXTRACT(IMPORTXML("http://...", "//div[@id='pledged']"), "^\S*")