Php 跟踪和筛选自定义分析的自动完成关键字

Php 跟踪和筛选自定义分析的自动完成关键字,php,mysql,autocomplete,statistics,analytics,Php,Mysql,Autocomplete,Statistics,Analytics,我正在创建一个内部定制的分析应用程序,我有一个有趣的问题,我想听听一些观点 我们正在跟踪的事件之一是用户的搜索关键字。但是,此函数实现为自动完成,在3个字符后提交搜索。所以一个搜索(或7个字符)实际上是作为5个查询提交的。。。这是一个典型的自动完成实现 我好奇的是,是否有人知道如何过滤那些没有价值的“垃圾”搜索,而不是用户想要的最终关键字。我不希望实现“GO”按钮并破坏自动完成即时过滤器功能 有什么建议、技术或算法被用来解决这个问题,有人有什么见解吗 我认为这无关紧要,但这是一个基于PHP/My

我正在创建一个内部定制的分析应用程序,我有一个有趣的问题,我想听听一些观点

我们正在跟踪的事件之一是用户的搜索关键字。但是,此函数实现为自动完成,在3个字符后提交搜索。所以一个搜索(或7个字符)实际上是作为5个查询提交的。。。这是一个典型的自动完成实现

我好奇的是,是否有人知道如何过滤那些没有价值的“垃圾”搜索,而不是用户想要的最终关键字。我不希望实现“GO”按钮并破坏自动完成即时过滤器功能

有什么建议、技术或算法被用来解决这个问题,有人有什么见解吗


我认为这无关紧要,但这是一个基于PHP/MySQL的SAAS。

我一直在研究这个问题,以便清理我们的搜索跟踪。很难找到关于如何在自定义实现中跟踪搜索的好文档

我发现最接近跟踪自动搜索的是Google的Adwords定义,即在Google即时搜索中注册广告印象的时间(键入时返回结果):

…当有人使用Google Instant进行搜索时,如果出现以下情况之一,则可以计算印象:

  • 此人开始键入,然后单击页面上的任意位置,如搜索结果、广告或相关搜索
  • 人员键入搜索,然后单击“搜索”按钮,按Enter键,或从下拉菜单中选择预测查询
  • 人员停止键入,结果显示至少三秒

我看到自动搜索跟踪的两个方面需要平衡

  • 我们希望捕获用户的行为,包括他/她的查找结果或放弃搜索尝试
  • 我们需要干净的数据,没有大量的部分字符串,这些字符串实际上是您的示例中描述的较长搜索尝试的一部分
  • 关键似乎是定义何时报告搜索活动。采用AdWords规则或类似规则将使我们更接近实际用户活动——在用户仍在打字时删除一些“垃圾”搜索。这似乎不是一个完美的、包罗万象的解决方案,而是一个微调报告的起点


    至于不实现“Go”按钮,上述规则实际上将其用作报告搜索的条件之一(“搜索”按钮)。如果您的其他条件足以进行筛选,您可能可以不使用。我一直在研究这个问题,以便清理我们的搜索跟踪。很难找到关于如何在自定义实现中跟踪搜索的好文档

    我发现最接近跟踪自动搜索的是Google的Adwords定义,即在Google即时搜索中注册广告印象的时间(键入时返回结果):

    …当有人使用Google Instant进行搜索时,如果出现以下情况之一,则可以计算印象:

    • 此人开始键入,然后单击页面上的任意位置,如搜索结果、广告或相关搜索
    • 人员键入搜索,然后单击“搜索”按钮,按Enter键,或从下拉菜单中选择预测查询
    • 人员停止键入,结果显示至少三秒

    我看到自动搜索跟踪的两个方面需要平衡

  • 我们希望捕获用户的行为,包括他/她的查找结果或放弃搜索尝试
  • 我们需要干净的数据,没有大量的部分字符串,这些字符串实际上是您的示例中描述的较长搜索尝试的一部分
  • 关键似乎是定义何时报告搜索活动。采用AdWords规则或类似规则将使我们更接近实际用户活动——在用户仍在打字时删除一些“垃圾”搜索。这似乎不是一个完美的、包罗万象的解决方案,而是一个微调报告的起点


    至于不实现“Go”按钮,上述规则实际上将其用作报告搜索的条件之一(“搜索”按钮)。如果您的其他条件足以进行筛选,您可能可以不使用。我一直在研究这个问题,以便清理我们的搜索跟踪。很难找到关于如何在自定义实现中跟踪搜索的好文档

    我发现最接近跟踪自动搜索的是Google的Adwords定义,即在Google即时搜索中注册广告印象的时间(键入时返回结果):

    …当有人使用Google Instant进行搜索时,如果出现以下情况之一,则可以计算印象:

    • 此人开始键入,然后单击页面上的任意位置,如搜索结果、广告或相关搜索
    • 人员键入搜索,然后单击“搜索”按钮,按Enter键,或从下拉菜单中选择预测查询
    • 人员停止键入,结果显示至少三秒

    我看到自动搜索跟踪的两个方面需要平衡

  • 我们希望捕获用户的行为,包括他/她的查找结果或放弃搜索尝试
  • 我们需要干净的数据,没有大量的部分字符串,这些字符串实际上是您的示例中描述的较长搜索尝试的一部分
  • 关键似乎是定义何时报告搜索活动。采用AdWords规则或类似规则将使我们更接近实际用户活动——在用户仍在打字时删除一些“垃圾”搜索。这似乎不是一个完美的、包罗万象的解决方案,而是一个微调报告的起点

    至于不执行,