Amazon s3 使用Splunk监视Amazon S3日志？_Amazon S3_Amazon Web Services_Splunk_Access Log

Amazon s3 使用Splunk监视Amazon S3日志？

amazon-s3 amazon-web-services

Amazon s3 使用Splunk监视Amazon S3日志？,amazon-s3,amazon-web-services,splunk,access-log,Amazon S3,Amazon Web Services,Splunk,Access Log,我们有一个庞大的扩展用户网络，我们使用徽章跟踪。总流量约为每月6000万次。我们目前正在考虑从一个相当缓慢的、基于数据库的日志记录解决方案（基于PHP messy…）切换到一个简单的基于日志的替代方案，该方案依赖于Amazon S3日志和Splunk 在将Splunk用于其他一些分析任务之后，我非常喜欢它。但不清楚如何在系统中设置像S3这样的源代码。似乎远程源需要安装Universal Forwarder，这不是一个选项对此有什么想法吗？很晚才回答，但我也在寻找同样的东西，发现了一个Splun

我们有一个庞大的扩展用户网络，我们使用徽章跟踪。总流量约为每月6000万次。我们目前正在考虑从一个相当缓慢的、基于数据库的日志记录解决方案（基于PHP messy…）切换到一个简单的基于日志的替代方案，该方案依赖于Amazon S3日志和Splunk

在将Splunk用于其他一些分析任务之后，我非常喜欢它。但不清楚如何在系统中设置像S3这样的源代码。似乎远程源需要安装Universal Forwarder，这不是一个选项

对此有什么想法吗？

很晚才回答，但我也在寻找同样的东西，发现了一个Splunk应用程序，它可以满足您的需求。不过我还没有尝试过。

我建议将j-son预处理的数据记录到documentdb数据库中。例如，将适合您的场景的azure队列或simmilar服务总线消息传递技术与azure documentdb结合使用。因此，我将保留您基于数据库的方法，并将其修改为无模式、易于扩展的基于文档的数据库。

我使用AWS Marketplace随时间推移按前缀、存储桶或存储类跟踪AWS S3存储使用总量；此外，它还按前缀和每个存储桶向我显示了以前版本的存储。它有一个将S3数据保存为splunk格式日志的设置，除了它的UI和webservice API之外，它还可以为您的用例工作

这就是我的理解

创建一个Splunk实例。使用网站版本或内部部署 splunk的AMI创建一个运行splunk的EC2

在EC2上安装AWS应用程序的Splunk附加组件

根据输入日志类型（例如Cloudtrail日志、配置日志、通用日志等）配置加载项并提供AWS帐户id或IAM角色等参数

加载项将在指定的时间（默认为30秒）后自动ping AWS S3源并获取最新日志

对于通用用例（如我们的），您可以尝试配置

我唯一的问题是，您的日志如何到达S3？您是否在X分钟/小时后将其滚动到那里。如果是这样，您将仅限于历史非实时视图。不管我们能不能，你有兴趣测试一下吗？如果是这样，请ping我。同样晚的补充：该应用程序不能很好地扩展。它有一个bug，阻止它读取超过1000个对象（它根本没有代码来处理被截断的列表）。它还有一些其他缺陷，似乎没有一个合适的方式在索引器之间分散负载。