在openrefine中提取包含字符串的html标记?

在openrefine中提取包含字符串的html标记?,html,openrefine,Html,Openrefine,标题没有什么可补充的。这就是我想做的。有什么建议吗 我查阅了github的文档,并在谷歌上进行了广泛搜索 我得到的最好结果是: value.parseHtml().select('p[contains('xyz')]') 它会导致语法错误 选择语法基于Beauty Soup()中的选择语法 在这种情况下,我相信您需要的语法是: value.parseHtml().select("p:contains(xyz)") 欧文也许你错过了我在维基上的文字(和警告):)这里 警告:在使用内置HTML

标题没有什么可补充的。这就是我想做的。有什么建议吗

我查阅了github的文档,并在谷歌上进行了广泛搜索

我得到的最好结果是:

value.parseHtml().select('p[contains('xyz')]')

它会导致语法错误

选择语法基于Beauty Soup()中的选择语法

在这种情况下,我相信您需要的语法是:

value.parseHtml().select("p:contains(xyz)")

欧文

也许你错过了我在维基上的文字(和警告):)这里

警告:在使用内置HTML GREL命令(默认输出为org.jsoup.nodes objects)时,如果需要将字符串输出到细化单元格中,请确保使用.toString()后缀。否则,您将在“表达式编辑器”(Expression Editor)中获得一个预览,但在应用它时,“优化”单元格中不会显示任何数据

顺便说一句,我们如何才能使文档更好,在哪里,以便有人在未来不会错过这一点

我甚至在我们的文档中给大家举了一个很好的例子,说明如何使用.toString()

试试这个:
value.parseHtml()。选择(“p[contains('xyz')”)
谢谢。这就解决了语法错误。然而。。。它不会给出任何结果,即使所讨论的段落肯定包含所选字符串。