在google docs电子表格中使用XPATH解析ImportXML的结果
我在google doc电子表格的单元格中具有以下功能:在google docs电子表格中使用XPATH解析ImportXML的结果,xml,xpath,google-docs,google-docs-api,Xml,Xpath,Google Docs,Google Docs Api,我在google doc电子表格的单元格中具有以下功能: =IMPORTXML(J15, "//meta[@name='description']/@content") 我需要从facebook页面的以下行中捕获值: 但是,我只需要从这个字符串中捕获“喜欢的数量”和“谈论这个”的数量,然后将其他所有文本都删除 为了对返回的字符串使用XPATH的tokenize()函数,我尝试了以下方法 =IMPORTXML(J2, "tokenize('//meta[@name='description']
=IMPORTXML(J15, "//meta[@name='description']/@content")
我需要从facebook页面的以下行中捕获值:
但是,我只需要从这个字符串中捕获“喜欢的数量”和“谈论这个”的数量,然后将其他所有文本都删除
为了对返回的字符串使用XPATH的tokenize()函数,我尝试了以下方法
=IMPORTXML(J2, "tokenize('//meta[@name='description']/@content', '.')")
但是,我得到一个错误:“无法解析导入的XML”
任何帮助都将不胜感激
Thx这是因为
IMPORTXML
需要Xpath表达式(类似于//meta[@name='description']/@content
)作为第二个参数
您可以使用正则表达式提取所需的数据
=REGEXEXTRACT(A1,"[0-9]+\s+likes")
=REGEXEXTRACT(A1,"[0-9]+\s+talking\s+about\s+this")
这是因为
IMPORTXML
需要一个Xpath表达式(类似于//meta[@name='description']]/@content
)作为第二个参数
您可以使用正则表达式提取所需的数据
=REGEXEXTRACT(A1,"[0-9]+\s+likes")
=REGEXEXTRACT(A1,"[0-9]+\s+talking\s+about\s+this")
substring after(substring before(//meta[@name='description']/@content,“谈论这个”),“)
返回68 likes.3
您可以使用translate函数删除字母:)如果您提供了实际的URL,这会有所帮助,因此我们可以进行测试。还请记住,google表单importXML中没有实现大量xpath函数。您最好按照文章顶部所述运行importXML,然后使用标准工作表函数处理字符串,例如SPLIT()或INDEX()或MID()@user3616725谢谢您的评论,我在后面添加了url子字符串(子字符串之前(//meta[@name='description']/@content,“谈论这个”),“)
返回68.3
您可以使用translate函数删除字母:)如果您提供了实际的URL,则会有所帮助,因此我们可以进行测试。还请记住,google表单importXML中没有实现大量xpath函数。您最好按照文章顶部所述运行importXML,然后使用标准工作表函数处理字符串,例如SPLIT()或INDEX()或MID()@user3616725谢谢您的评论,我添加了url
=REGEXEXTRACT(A1,"[0-9]+\s+likes")
=REGEXEXTRACT(A1,"[0-9]+\s+talking\s+about\s+this")