在openrefine中提取包含字符串的html标记？_Html_Openrefine

在openrefine中提取包含字符串的html标记？

html

在openrefine中提取包含字符串的html标记？,html,openrefine,Html,Openrefine,标题没有什么可补充的。这就是我想做的。有什么建议吗我查阅了github的文档，并在谷歌上进行了广泛搜索我得到的最好结果是： value.parseHtml().select('p[contains('xyz')]') 它会导致语法错误选择语法基于Beauty Soup（）中的选择语法在这种情况下，我相信您需要的语法是： value.parseHtml().select("p:contains(xyz)") 欧文也许你错过了我在维基上的文字（和警告）：）这里警告：在使用内置HTML

标题没有什么可补充的。这就是我想做的。有什么建议吗

我查阅了github的文档，并在谷歌上进行了广泛搜索

我得到的最好结果是：

value.parseHtml().select('p[contains('xyz')]')

它会导致语法错误

选择语法基于Beauty Soup（）中的选择语法

在这种情况下，我相信您需要的语法是：

value.parseHtml().select("p:contains(xyz)")

欧文

也许你错过了我在维基上的文字（和警告）：）这里

警告：在使用内置HTML GREL命令（默认输出为org.jsoup.nodes objects）时，如果需要将字符串输出到细化单元格中，请确保使用.toString（）后缀。否则，您将在“表达式编辑器”（Expression Editor）中获得一个预览，但在应用它时，“优化”单元格中不会显示任何数据

顺便说一句，我们如何才能使文档更好，在哪里，以便有人在未来不会错过这一点

我甚至在我们的文档中给大家举了一个很好的例子，说明如何使用.toString（）

试试这个：

value.parseHtml（）。选择（“p[contains（'xyz'）”）

谢谢。这就解决了语法错误。然而。。。它不会给出任何结果，即使所讨论的段落肯定包含所选字符串。