Logging 什么用于实时日志聚合和查询?
Logging 什么用于实时日志聚合和查询?,logging,real-time,hbase,Logging,Real Time,Hbase,我正在搜索工具/数据库/解决方案,它可以帮助我聚合实时日志,并可以实时查询日志。 基本要求是能够尽快交付结果,请记住,可能有许多事件要查询(可能有数十亿),但日志将有许多“列”,每个查询将在这些列上设置一些条件,因此最终结果将是某种聚合,或者只返回一小部分行 现在我正在研究HDFS+HBase,这似乎是一个很好的解决方案。还有其他选择吗?你能推荐什么吗?你可以看看。在商业世界中有。您可以检查Flume:。如果您尝试实时解析/收集日志,并对此采取一些措施,那么我的建议如下: # tail --fo
我正在搜索工具/数据库/解决方案,它可以帮助我聚合实时日志,并可以实时查询日志。
基本要求是能够尽快交付结果,请记住,可能有许多事件要查询(可能有数十亿),但日志将有许多“列”,每个查询将在这些列上设置一些条件,因此最终结果将是某种聚合,或者只返回一小部分行
现在我正在研究HDFS+HBase,这似乎是一个很好的解决方案。还有其他选择吗?你能推荐什么吗?你可以看看。在商业世界中有。您可以检查Flume:。如果您尝试实时解析/收集日志,并对此采取一些措施,那么我的建议如下:
# tail --follow=name --retry /var/log/logfile.log | sendxmpp -i -u username -p password -j somejabberserver.com sendloglineto@somejabberserver.com
这将把日志中显示为XMPP消息的每一行发送给jabber用户sendloglineto@somejabberserver.com. jabber用户将是通过您编写的客户机/软件连接的用户(我更喜欢perl和Net::jabber)。您可以对客户机进行编程,使其可以对每个XMPP消息执行任何操作(例如,存储在数据库中)。如果将其存储在CouchDB中,则可以使用_changesAPI跟踪CouchDB所服务的特定数据库的更新。试试ApacheKafka。这对你的案例应该是有帮助的,尽管这是一个老问题,我现在用技术堆栈发布答案,现在可以使用了
这很好,但我也在寻找有助于存储日志的东西(如HDFS+HBase),calamaris似乎只从本地存储的web访问日志生成报告。Splunk可能有些过分,我只需要一层存储和查询引擎。Flume可能有助于将日志写入HDFS,但无法解决查询此数据的问题。@Wojtek:基于这个问题,我假设Hadoop HDFS+HBase将用于整理/查询数据。可能,我仍在寻找替代方案。但水槽(+HBase水槽)+HBase+HDFS似乎是一个不错的选择。