elasticsearch,Twitter,elasticsearch" /> elasticsearch,Twitter,elasticsearch" />

Twitter 弹性搜索的索引标准

Twitter 弹性搜索的索引标准,twitter,elasticsearch,Twitter,elasticsearch,我正在使用twitter流媒体api。我对确定数据索引的标准有点困惑。现在我有一个索引,它包含一个文档类型中的所有tweet和另一个文档类型中的用户 这是存储它们的最佳方式,还是我应该为每个类别创建一个新的文档类型(类别可以根据标签和tweet内容确定) 存储此类数据的最佳方法是什么 提前感谢。首先,您的问题的答案是,这在很大程度上取决于您的用例。你的应用程序在做什么?你怎么处理这些推文?你计划有多少类别 不过,我通常会选择一种解决方案,即对所有tweet使用相同的索引和相同的doc\u类型。这

我正在使用twitter流媒体api。我对确定数据索引的标准有点困惑。现在我有一个索引,它包含一个文档类型中的所有tweet和另一个文档类型中的用户

这是存储它们的最佳方式,还是我应该为每个类别创建一个新的文档类型(类别可以根据标签和tweet内容确定)

存储此类数据的最佳方法是什么


提前感谢。

首先,您的问题的答案是,这在很大程度上取决于您的用例。你的应用程序在做什么?你怎么处理这些推文?你计划有多少类别

不过,我通常会选择一种解决方案,即对所有tweet使用相同的索引和相同的
doc\u类型。这允许您在所有tweet上构建查询和聚合,而无需考虑不同类型的类别。它还允许您轻松添加新类别,而无需更改查询

如果您想对tweet进行分类,可以在elasticsearch中存储的tweet文档中添加一个category字段。然后,您可以使用此类别字段来实现特定的应用程序逻辑

如果类别名称中有空格或标点符号,请不要忘记将类别字段定义为
未分析
。否则它将被分解成部分