在google docs电子表格中使用XPATH解析ImportXML的结果_Xml_Xpath_Google Docs_Google Docs Api

在google docs电子表格中使用XPATH解析ImportXML的结果

xml xpath

在google docs电子表格中使用XPATH解析ImportXML的结果,xml,xpath,google-docs,google-docs-api,Xml,Xpath,Google Docs,Google Docs Api,我在google doc电子表格的单元格中具有以下功能： =IMPORTXML(J15, "//meta[@name='description']/@content") 我需要从facebook页面的以下行中捕获值：但是，我只需要从这个字符串中捕获“喜欢的数量”和“谈论这个”的数量，然后将其他所有文本都删除为了对返回的字符串使用XPATH的tokenize（）函数，我尝试了以下方法 =IMPORTXML(J2, "tokenize('//meta[@name='description']

我在google doc电子表格的单元格中具有以下功能：

=IMPORTXML(J15, "//meta[@name='description']/@content")

我需要从facebook页面的以下行中捕获值：

但是，我只需要从这个字符串中捕获“喜欢的数量”和“谈论这个”的数量，然后将其他所有文本都删除

为了对返回的字符串使用XPATH的tokenize（）函数，我尝试了以下方法

=IMPORTXML(J2, "tokenize('//meta[@name='description']/@content', '.')")

但是，我得到一个错误：“无法解析导入的XML”

任何帮助都将不胜感激

Thx

这是因为

IMPORTXML

需要Xpath表达式（类似于

//meta[@name='description']/@content

）作为第二个参数

您可以使用正则表达式提取所需的数据

=REGEXEXTRACT(A1,"[0-9]+\s+likes")

=REGEXEXTRACT(A1,"[0-9]+\s+talking\s+about\s+this")

这是因为

IMPORTXML

需要一个Xpath表达式（类似于

//meta[@name='description']]/@content

）作为第二个参数

您可以使用正则表达式提取所需的数据

=REGEXEXTRACT(A1,"[0-9]+\s+likes")

=REGEXEXTRACT(A1,"[0-9]+\s+talking\s+about\s+this")

substring after（substring before（//meta[@name='description']/@content，“谈论这个”），“）

68 likes.3

您可以使用translate函数删除字母：）如果您提供了实际的URL，这会有所帮助，因此我们可以进行测试。还请记住，google表单importXML中没有实现大量xpath函数。您最好按照文章顶部所述运行importXML，然后使用标准工作表函数处理字符串，例如SPLIT（）或INDEX（）或MID（）@user3616725谢谢您的评论，我在后面添加了url

子字符串（子字符串之前（//meta[@name='description']/@content，“谈论这个”），“）

68.3

您可以使用translate函数删除字母：）如果您提供了实际的URL，则会有所帮助，因此我们可以进行测试。还请记住，google表单importXML中没有实现大量xpath函数。您最好按照文章顶部所述运行importXML，然后使用标准工作表函数处理字符串，例如SPLIT（）或INDEX（）或MID（）@user3616725谢谢您的评论，我添加了url

=REGEXEXTRACT(A1,"[0-9]+\s+likes")

=REGEXEXTRACT(A1,"[0-9]+\s+talking\s+about\s+this")