Python 如何构建性能良好的实时推荐引擎?

Python 如何构建性能良好的实时推荐引擎?,python,html,Python,Html,我是一名数据分析师,刚刚被指派为我们的网站构建一个实时推荐引擎 我需要分析访客行为,并对这些输入进行实时分析。因此,我对这个项目有三个问题 1) 用户不必被迫注册。是否有任何方法来捕获用户行为,如搜索和访问历史 2) 推荐模型可以预先训练,但预测过程需要时间。我们如何提高性能 3) 我只知道如何编写Python脚本。如何使用python脚本实现推荐引擎 谢谢 ============================== 然而,我们90%的客户在第一次访问时购买了产品,并且不会很快回来。 我们不能

我是一名数据分析师,刚刚被指派为我们的网站构建一个实时推荐引擎

我需要分析访客行为,并对这些输入进行实时分析。因此,我对这个项目有三个问题

1) 用户不必被迫注册。是否有任何方法来捕获用户行为,如搜索和访问历史

2) 推荐模型可以预先训练,但预测过程需要时间。我们如何提高性能

3) 我只知道如何编写Python脚本。如何使用python脚本实现推荐引擎

谢谢

==============================

然而,我们90%的客户在第一次访问时购买了产品,并且不会很快回来。 我们不能为新来访者制作现成的模型。 他们更喜欢使用itemCF作为推荐引擎。
这听起来像是一个不可能完成的任务…

这是一个相当广泛的问题,但我会尽我所能回答:

通过在您的域上启用某种形式的分析跟踪,可以跟踪访问历史。这可以是您实施的预构建解决方案,并将提供您域的所有访问者的详细概述,通常带有某种形式的仪表板。大多数预构建的解决方案提供了一种获取已收集分析的方法

另一种方法是使用浏览器cookie存储与您的域的每次访问及其搜索/页面历史记录相关的信息。每当用户在同一浏览器中访问网站时,该信息都将提供给该网站。当用户访问您的网站时,您可以将信息发送到服务器/rest端点,该端点可以分析信息(I.P/地理位置/访问次数/搜索/页面历史记录),并据此提出建议。另一种常用的方法是跟踪过去的购买情况

为了提高性能,一个解决方案是始终为特定用户准备好预测模型,以备下次访问站点时使用。这样,就不会有延误。但是,用户第一次访问时,您可能没有足够的信息进行详细的预测,因此您必须根据地理位置提供选项(这不会花费很长时间,也不会影响性能)

还有一种方法可以采用,上面主要讨论的是根据用户浏览网站的行为进行预测。基于内容的过滤是另一种方法,它将推荐与用户当前查看的项目类似的内容。这种方法通常比较简单,因为它只需要查询数据库中在类别、用途等方面相似的项


在客户端使用javascript是不可能的,但是您的推荐引擎可以用Python构建(它可以是一个简单的restapi端点,可以访问items数据库)。大多数人使用flask、django或eve在Python中实现REST API。

这太宽泛了。到目前为止,您尝试/编写了哪些代码?实际上,我被指派制定一个项目提案,并将其发送给我们的it供应商。我目前的工作职责主要是使用jupyter笔记本编写分析报告,因此我完全不知道如何开发web应用程序。谢谢。我已经实现了ApacheStorm来满足我的需求。谢谢你的回答!然而,我们90%的客户在第一次访问时购买了产品,并且不会很快回来。我们不能为新来访者制作现成的模型。他们更喜欢使用itemCF作为推荐引擎。这听起来像是一个不可能完成的任务。。。