用java解析apachetomcat访问日志

用java解析apachetomcat访问日志,java,parsing,logging,Java,Parsing,Logging,使用java解析apache accesslog文件的最佳方法是什么 是使用stringtokenizer还是有专门用于解析apache日志文件的第三方库?IMHO,stringtokenizer太蠢了,而第三方库对于这样简单的东西来说可能是一种过分的手段。我会编写一个简单的正则表达式,只要它不是关键的并且在我的控制下运行。有280k个匹配项,前两个似乎是免费库。看看JMeter的TCLogParser[|]。它实际上是从JMeter内部使用的,但是您可以检查源代码并根据自己的需要进行更改。没有

使用java解析apache accesslog文件的最佳方法是什么


是使用stringtokenizer还是有专门用于解析apache日志文件的第三方库?

IMHO,stringtokenizer太蠢了,而第三方库对于这样简单的东西来说可能是一种过分的手段。我会编写一个简单的正则表达式,只要它不是关键的并且在我的控制下运行。有280k个匹配项,前两个似乎是免费库。

看看JMeter的
TCLogParser
[|]。它实际上是从JMeter内部使用的,但是您可以检查源代码并根据自己的需要进行更改。

没有专门用于解析tomcat日志文件的第三部分库。不过,你可以自己做很多事情:

  • 定义日志文件的特征和必要的阀门格式
  • 定义需要处理的操作(访问日志、struts操作等)
  • 读入日志文件的行并拆分它们(即
    oneLine.split(“,0”);
  • 如果需要,将所需组件存储在数据库中。DB会给你很多自由
  • 你准备好出发了

    可旋转日志文件更易于使用。你会有很多,但更小。 过滤掉任何不必要的行


    解析取决于您在server.xml中使用的模式。

    一个复杂的解决方案将从server.xml文件中读取阀模式,并知道如何解析它。

    在该文件中,您将发现一个名为
    LogParser
    的类,它涵盖了一些accesslog格式。此外,我们正在使用Hadoop完成所有过程,这意味着您将能够使用商品硬件并行分析大量的accesslog。

    查看[Web日志分析器]

    您可以尝试使用日志解析器:解析访问日志。它解析日志并生成相应的CSV文件。