Apache日志文件格式的R分析

Apache日志文件格式的R分析,r,R,我试着用R分析weblog文件。我可以轻松地处理日期和字节,只要有数字数据,但无法处理字符串 从日志文件(CSV格式的日志文件)中,我想了解特定用户(在IP和代理的帮助下)及其在网页上的总开支 有许多库可以进行这种分析,尽管我在R中找不到。google forparse apache logfile产生了这种分析,而python parse apache logfile产生了这种分析。两者都依赖于解析文件的内容 这里有两种处理apache日志文件的方法: 从R调用perl或python,或者使

我试着用R分析weblog文件。我可以轻松地处理日期和字节,只要有数字数据,但无法处理字符串


从日志文件(CSV格式的日志文件)中,我想了解特定用户(在IP和代理的帮助下)及其在网页上的总开支

有许多库可以进行这种分析,尽管我在R中找不到。google for
parse apache logfile
产生了这种分析,而
python parse apache logfile
产生了这种分析。两者都依赖于解析文件的内容

这里有两种处理apache日志文件的方法:

  • 从R调用perl或python,或者使用直接链接,或者使用系统调用(这更简单)
  • 借鉴perl或python库的思想,并使用它实现R版本的函数。这需要很多时间
您引用了一个csv文件,但我认为上面的库与Apache日志的原始文本文件一起工作,因此我将使用它们,而不是您的csv文件


此外,还提到了@doug()的一个回答,他在回答中说,他创建了一些函数来创建由Python解析的apache日志文件数据的可视化。也许你可以给他发个短信或邮件,看看他是否愿意分享代码。

R中的日志文件分析是我们以前讨论过的一个有趣的话题,你可以找到我们的讨论。也许这次讨论也可以帮助你适应SO礼仪,以便获得更好的反馈(保罗,不要从你身上拿走任何东西)。

看起来你希望有人为你做这项工作。到目前为止你尝试了什么?可能重复@dickoa:无论我做了什么工作,我都试图把它的快照放在这里,但是最近的会员没有资格把我在分享时得到的快照放在这里……谢谢你提供的额外信息,我的答案中已经有了链接。