elasticsearch 弹性堆栈twitter示例tweets,elasticsearch,twitter,twitter-oauth,elastic-stack,elasticsearch,Twitter,Twitter Oauth,Elastic Stack" /> elasticsearch 弹性堆栈twitter示例tweets,elasticsearch,twitter,twitter-oauth,elastic-stack,elasticsearch,Twitter,Twitter Oauth,Elastic Stack" />

elasticsearch 弹性堆栈twitter示例tweets

elasticsearch 弹性堆栈twitter示例tweets,elasticsearch,twitter,twitter-oauth,elastic-stack,elasticsearch,Twitter,Twitter Oauth,Elastic Stack,我不熟悉弹性堆栈,不知道如何解决这个问题。我已经成功地使用弹性Twitter输入插件获得了带有特定关键字的实时推文流,但是我想获得一个没有特定关键字的实时推文示例,只是所有实时推文的一个百分比。我试图搜索如何做到这一点,但找不到好的文档,我相信我需要使用GET Status/sample API,但没有相关文档。这就是我现在所拥有的: input { twitter { consumer_key => " cosumer_key" consumer_secret

我不熟悉弹性堆栈,不知道如何解决这个问题。我已经成功地使用弹性Twitter输入插件获得了带有特定关键字的实时推文流,但是我想获得一个没有特定关键字的实时推文示例,只是所有实时推文的一个百分比。我试图搜索如何做到这一点,但找不到好的文档,我相信我需要使用GET Status/sample API,但没有相关文档。这就是我现在所拥有的:

input {
  twitter {
      consumer_key => " cosumer_key"
      consumer_secret => "consumer_secret"
      oauth_token => "token"
      oauth_token_secret => "secret"
      keywords => ["something"]
      languages => ["en"]
      full_tweet => true
  }
}
output {
    elasticsearch {}
}
我如何在不使用关键字的情况下搜索所有示例推文


事先非常感谢你

下面是一个随机分数查询示例,这应该可以解决您的问题:

GET /twitter/_search
{
"query": {
"function_score": {
      "query": {
        "match_all": {}
      },
      "functions": [
        {
        "random_score": {}
        }
      ]
    }
  }
}
编辑-添加同时接受随机条目的日志存储配置:

input {
  twitter {
      consumer_key => " cosumer_key"
      consumer_secret => "consumer_secret"
      oauth_token => "token"
      oauth_token_secret => "secret"
      keywords => ["something"]
      languages => ["en"]
      full_tweet => true,
      use_samples => true
  }
}
output {
    elasticsearch {}
}
:

返回所有公共状态的小随机样本。默认访问级别返回的tweet是相同的,因此如果两个不同的客户端连接到此端点,它们将看到相同的tweet。如果设置为true,则将忽略关键字、跟随、位置和语言选项。违约⇒ 假的


下面是一个随机分数查询示例,这应该可以解决您的问题:

GET /twitter/_search
{
"query": {
"function_score": {
      "query": {
        "match_all": {}
      },
      "functions": [
        {
        "random_score": {}
        }
      ]
    }
  }
}
编辑-添加同时接受随机条目的日志存储配置:

input {
  twitter {
      consumer_key => " cosumer_key"
      consumer_secret => "consumer_secret"
      oauth_token => "token"
      oauth_token_secret => "secret"
      keywords => ["something"]
      languages => ["en"]
      full_tweet => true,
      use_samples => true
  }
}
output {
    elasticsearch {}
}
:

返回所有公共状态的小随机样本。默认访问级别返回的tweet是相同的,因此如果两个不同的客户端连接到此端点,它们将看到相同的tweet。如果设置为true,则将忽略关键字、跟随、位置和语言选项。违约⇒ 假的


我是否正确地理解了,您只是想要一些您已经索引的结果?GET twitter/\u Search现在我收到的推文都包含关键字“something”,我想要的是一个实时随机样本推文数据集,没有任何特定的关键字。我是否理解正确,你只是想要一些你已经索引的结果?GET twitter/\u Search现在我收到的推文都包含关键字“某物”,我想要的是实时随机样本推文的数据集,没有任何特定的关键字。我需要更改我上面附加的twitter.conf文件(用于日志存储)吗?或者我只是把这个查询添加到elasticsearch中?如果这是一个愚蠢的问题,我很抱歉,我对这个问题非常陌生,我发现很难找到关于如何做到这一点的清晰文档。非常感谢您的帮助。logstash配置与此完全无关。您只需要对logstash正在向其发送数据的弹性实例运行此查询。我提供的答案是我在Kibana的developer选项卡中执行的代码片段,但是您可以通过任何可以向您的elastic实例发出请求的方式来执行类似的操作。查看curl或控制台示例,了解如何使用此请求:“Postman”是我在没有Kibana的情况下为elastic选择的API工具。我在Kibana控制台中尝试了该代码,但我仍然只得到配置文件中设置的关键字(我的关键字是“london”)的结果,请参见下面的屏幕截图。我明白你的意思了,你使用的logstash配置肯定限制了你可以接受的范围。查看此文档,您似乎无法对关键字进行通配符,但可以使用“use_samples”选项对所有tweet进行采样。我认为这是可行的!其实我以前也试过,但我想不是用正确的方法。现在我也收到了不同语言的推特,但我并不为此烦恼。再次感谢您我是否需要更改我上面附加的twitter.conf文件(用于日志存储)?或者我只是把这个查询添加到elasticsearch中?如果这是一个愚蠢的问题,我很抱歉,我对这个问题非常陌生,我发现很难找到关于如何做到这一点的清晰文档。非常感谢您的帮助。logstash配置与此完全无关。您只需要对logstash正在向其发送数据的弹性实例运行此查询。我提供的答案是我在Kibana的developer选项卡中执行的代码片段,但是您可以通过任何可以向您的elastic实例发出请求的方式来执行类似的操作。查看curl或控制台示例,了解如何使用此请求:“Postman”是我在没有Kibana的情况下为elastic选择的API工具。我在Kibana控制台中尝试了该代码,但我仍然只得到配置文件中设置的关键字(我的关键字是“london”)的结果,请参见下面的屏幕截图。我明白你的意思了,你使用的logstash配置肯定限制了你可以接受的范围。查看此文档,您似乎无法对关键字进行通配符,但可以使用“use_samples”选项对所有tweet进行采样。我认为这是可行的!其实我以前也试过,但我想不是用正确的方法。现在我也收到了不同语言的推特,但我并不为此烦恼。再次感谢你