elasticsearch &引用;美国“;非[“美国”、“州”],elasticsearch,kibana,word-cloud,elasticsearch,Kibana,Word Cloud" /> elasticsearch &引用;美国“;非[“美国”、“州”],elasticsearch,kibana,word-cloud,elasticsearch,Kibana,Word Cloud" />

elasticsearch &引用;美国“;非[“美国”、“州”]

elasticsearch &引用;美国“;非[“美国”、“州”],elasticsearch,kibana,word-cloud,elasticsearch,Kibana,Word Cloud,我在elasticsearch中有文本字段,我想在kibana上将单词云可视化 第一步我们需要标记它们,我使用“标准标记器”。。。 使用此表单的word云可视化结果图片如下: 但我需要的是像“美国”、“联合国”、“安全理事会”和。。。我一定不要分开,我想要一个像这样的词: *专有名词或短语可能在2-5个单词之间。(如“中华人民共和国”) 我该怎么办? 这与N-Gram有关吗 示例文本: 美利坚合众国是联合国宪章成员 联合国和联合国安全理事会五个常任理事国之一 理事会 美国是联合国总部的东道国,

我在elasticsearch中有文本字段,我想在kibana上将单词云可视化

第一步我们需要标记它们,我使用“标准标记器”。。。 使用此表单的word云可视化结果图片如下:

但我需要的是像“美国”、“联合国”、“安全理事会”和。。。我一定不要分开,我想要一个像这样的词: *专有名词或短语可能在2-5个单词之间。(如“中华人民共和国”)

我该怎么办? 这与N-Gram有关吗

示例文本:

美利坚合众国是联合国宪章成员 联合国和联合国安全理事会五个常任理事国之一 理事会

美国是联合国总部的东道国, 其中包括大会通常在纽约举行的会议地点 纽约市、安全理事会所在地和联合国若干机构 联合国。美国是最大的金融服务提供者 对联合国的捐款,占联合国预算的22% 2017年整个联合国预算(相比之下,第二大贡献者) 是日本占了近10%,而欧盟国家总共支付了10% 超过百分之三十)。2016年7月至2017年6月,28.6%的 用于维持和平行动的预算由联合国提供 国家。美国在建立联合国方面发挥了关键作用 联合国


此任务是NER任务,不是标准的标记化任务。有一些插件可以用elastic实现这一点,但没有一个是有前途的

为了实现这一点,您需要在应用程序端预处理数据。使用NLP解析器(Standford Core NLP,Spacy…)并提取命名实体。在映射中创建一个关键字字段(称为entities for eg),将从每个文档中提取的实体保存为数组,然后可以使用此字段生成word cloud

祝你好运