Machine learning 使用机器学习技术进行自动日志文件分析,以更好地了解用户行为

Machine learning 使用机器学习技术进行自动日志文件分析,以更好地了解用户行为,machine-learning,logfile-analysis,Machine Learning,Logfile Analysis,我必须使用机器学习技术自动分析json日志文件,以便更好地理解用户行为并识别频繁执行的操作,从而提高应用程序的可用性。日志文件包含文件系统事件、鼠标事件、键盘事件、应用程序事件(启动、终止、活动、停用等)等条目。。。在使用特定应用程序期间记录的 记录的条目如下所示: { "timestamp" : "20150427T100724.571637", "entry" : { "eventType" : 1,

我必须使用机器学习技术自动分析json日志文件,以便更好地理解用户行为并识别频繁执行的操作,从而提高应用程序的可用性。日志文件包含文件系统事件、鼠标事件、键盘事件、应用程序事件(启动、终止、活动、停用等)等条目。。。在使用特定应用程序期间记录的

记录的条目如下所示:

       {
        "timestamp" : "20150427T100724.571637",
        "entry" : 
        {
            "eventType" : 1,
            "eventTypeString" : "created",
            "nodePath" : "/Applications/Firefox.app",
            "nodeType" : 3,
            "nodeTypeString" : "directory"
        },
        "entryType" : 4
    },

    {
        "timestamp" : "20150427T100729.072595",
        "entry" : 
        {
            "eventType" : 2,
            "eventTypeString" : "clickRight",
            "mouseType" : 1,
            "mouseTypeString" : "local",
            "positionX" : 2517,
            "positionY" : 166,
            "scrollWheel" : 0.0
        },
        "entryType" : 1
    },

    {
        "timestamp" : "20150427T100730.270000",
        "entry" : 
        {
            "eventType" : 2,
            "eventTypeString" : "unmounted",
            "volumeName" : "Firefox",
            "volumePath" : "/Volumes/Firefox"
        },
        "entryType" : 9
    },

    {
        "timestamp" : "20150427T100730.281202",
        "entry" : 
        {
            "eventType" : 2,
            "eventTypeString" : "removed",
            "nodePath" : "/Volumes/Firefox",
            "nodeType" : 3,
            "nodeTypeString" : "directory"
        },
        "entryType" : 4
    },

    {
        "timestamp" : "20150427T100732.668000",
        "entry" : 
        {
            "eventType" : 4,
            "eventTypeString" : "activated",
            "launchDate" : "20150427T100732.668000",
            "ownsMenuBar" : true,
            "processId" : 7011,
            "processName" : "TeamViewer"
        },
        "entryType" : 5
    },

我已经进入了机器学习的主题,但我不知道哪种特定的技术或甚至该领域的子领域可以帮助我解决这个问题。也许有人对在哪里找到解决方案的正确信息或概念有一个提示或想法?

好的,这个问题对我来说并不完全清楚,但无论我基于什么理解,这些都是我的观点

  • 分类,不确定如何在这里应用
  • 聚类同上

  • 概率的范围很大,特别是概率图形模型, 例如在文件系统中,如果他打开c://然后打开songs文件夹,那么他的下一个文件夹选择很可能是Rihanna文件夹或Emineem,这些内容在某种程度上可以通过图形模型进行建模。您可以制作自定义模型。这是一个非常重要的话题,看看这个