Parsing 有好的开源库可以解析URL中的搜索词吗?

Parsing 有好的开源库可以解析URL中的搜索词吗?,parsing,log-analysis,Parsing,Log Analysis,我正在寻找一个库,它可以解析日志文件或传入请求,并在请求来自搜索引擎时提取出搜索词 有没有提供此功能的好库 任何语言都可以。Java有Lucene框架,这是一个高性能的文本搜索引擎。日志文件可以处理这个问题,但对于传入的请求可能更复杂。您需要在数据流输入时解析它吗?有很多方法可以获取、解析和分析您所说的数据 非常简单,您可以使用日志文件文本并将其导入SQL数据库中进行分析,从而还可以查看其他请求,等等 你可以使用谷歌分析等软件服务 或者我个人最喜欢的: 将SQL插入写入跟踪表。这样,您就可以将字

我正在寻找一个库,它可以解析日志文件或传入请求,并在请求来自搜索引擎时提取出搜索词

有没有提供此功能的好库


任何语言都可以。

Java有Lucene框架,这是一个高性能的文本搜索引擎。日志文件可以处理这个问题,但对于传入的请求可能更复杂。您需要在数据流输入时解析它吗?

有很多方法可以获取、解析和分析您所说的数据

非常简单,您可以使用日志文件文本并将其导入SQL数据库中进行分析,从而还可以查看其他请求,等等

你可以使用谷歌分析等软件服务

或者我个人最喜欢的:

将SQL插入写入跟踪表。这样,您就可以将字符串解析为子句——非常简单地用单词分隔。这样做的缺点是,你会错过关键字短语,例如“纽约是两个单词”

建议Lucene的人提供了一些信息,可能会让你想出一个非常简洁的分析器,但要得到一个完整的解决方案需要很多工作。Lucene和Solr的巧妙之处在于,他们可以使用标准库对关键字字符串进行标记,在有复合词或关键字的地方,分块出两到三个单词的子句


从实用的角度来看,我认为最好使用现成的东西,比如谷歌分析。如果你有时间和技能,在数据库中插入一条记录可以在你添加它时变得非常强大。

有趣的建议。。。我不能使用谷歌分析,因为我试图做本地分析。