网站不完整结果的Xpath清理
我正在尝试使用Google电子表格功能“importXML”从Khan Academy网站获取所有链接和标题: 到目前为止,我已经尝试:网站不完整结果的Xpath清理,xpath,google-sheets,web-crawler,Xpath,Google Sheets,Web Crawler,我正在尝试使用Google电子表格功能“importXML”从Khan Academy网站获取所有链接和标题: 到目前为止,我已经尝试: =IMPORTXML("https://www.khanacademy.org/commoncore/grade-HSA-A-SSE", "//a[@class='standard-preview']") 它带来了29个结果,但不是所有的“a”元素和类“标准预览”。在网页上,该类的元素比29个结果多得多 如何使用“标准预览”类获取所有元素。为什么我的xpa
=IMPORTXML("https://www.khanacademy.org/commoncore/grade-HSA-A-SSE", "//a[@class='standard-preview']")
它带来了29个结果,但不是所有的“a”元素和类“标准预览”。在网页上,该类的元素比29个结果多得多
如何使用“标准预览”类获取所有元素。为什么我的xpath不返回一些值
我的电子表格如下:
您能否共享该页面上的两个元素?这些元素不会出现?我想您都有。如果你去查看源代码并查找'a class=“standard preview',你会得到29个。嗯,很有趣。当我搜索“标准预览”课程时,我得到了83个结果。如果你看网页,我试图抓取的是课程标题及其超链接。它们是页面的主要内容。一位人士建议,页面的内容可能是动态加载的,谷歌的功能“importXML”不会等到动态内容加载后才运行。