Python 谷歌应用程序引擎是一个有价值的Lifestreaming应用程序平台吗?

Python 谷歌应用程序引擎是一个有价值的Lifestreaming应用程序平台吗?,python,django,google-app-engine,web-applications,Python,Django,Google App Engine,Web Applications,我正在构建一个Lifestreaming应用程序,它将为许多用户提供大量提要,并对结果执行数据挖掘和机器学习算法。GAE的负载平衡和可扩展的托管听起来很适合最终可能移动大量数据的系统,但缺少cron作业是一个麻烦。我是否最好在co-loc上使用Django并处理我自己的DB扩展 当他们提供付费计划时,情况可能会改变,但目前来看,应用程序引擎不适合CPU密集型应用程序。它被设计为可扩展以处理大量请求,而不必为每个请求进行大量计算。我遇到这个问题的时候只进行了很小的计算,我担心随着我的数据集的增长,

我正在构建一个Lifestreaming应用程序,它将为许多用户提供大量提要,并对结果执行数据挖掘和机器学习算法。GAE的负载平衡和可扩展的托管听起来很适合最终可能移动大量数据的系统,但缺少cron作业是一个麻烦。我是否最好在co-loc上使用Django并处理我自己的DB扩展

当他们提供付费计划时,情况可能会改变,但目前来看,应用程序引擎不适合CPU密集型应用程序。它被设计为可扩展以处理大量请求,而不必为每个请求进行大量计算。我遇到这个问题的时候只进行了很小的计算,我担心随着我的数据集的增长,我可能不得不开始寻找其他地方。

不。如果你需要做很多事情,App Engine将无法正常工作。在进行离线预处理后,您可以将数据放入他们的存储中,将其用作前端,但如果不执行一些非常疯狂的操作,您无法在每个请求的~1秒钟内完成很多工作


你的应用程序最好由你自己托管。

获取提要或进行计算不会有问题。但是你很快就要为你的帐户付款了。AppEngine包括Django,但您需要为模型部件使用一些适配器。它肯定会让你免于维护方面的麻烦。

如果你的应用程序完全依赖于Django,那么应用程序引擎就是一个不错的选择。然而,如果您需要添加C增强的库,您就麻烦了。AppEngine不支持PIL或ReportLab之类的东西,它们使用C来加快处理时间。我之所以提到这一点,是因为从长远来看,您可能希望使用C来加速某些例程

如果您决定使用联合loc,请访问webpartion.com。他们对Django/Python有很好的支持,而且他们对您使用上述lirbaries没有任何问题。

看一看:他们销售基于xen的虚拟化服务器实例,起价为20.00美元/月

我们和你一样。厌倦了超卖, 表现不佳的、过时的托管 公司。我们把事情考虑进去了 自己动手。我们建立了一个托管公司 对于那些知道自己的东西的人。给予 给我们一个盒子,给我们带宽,给我们 我们开始工作。快速的 机器,RAID-10驱动器,第1层 带宽和根访问。管理 使用定制的Xen VPS后端 确保你的资源得到充分利用 受到保护和保证


这非常适合在上启动项目并扩展它,而不会产生托管提供商或COO的成本。

虽然我不能直接回答您的问题,但我构建(一个在AppEngine上收集几百个提要的新闻聚合器)的经验可能会让您有所了解

  • 获取提要。通过cron作业获取大量提要(在sdk1.2.5之前,这是唯一的解决方案)效率不高且不可扩展,作业频率有较低的限制(比如1分钟,因此每小时最多只能获取60个提要)。对于最新的SDK 1.2.5,我还没有实现。最好的方法是,您提供一个回调url,HubBub将实时通知您新条目。还有一个在AppEngine上,你可以在那里玩

  • 解析提要。您可能已经知道解析提要是cpu密集型的。我使用MarkPilgrim,当解析一个大提要(比如一个公共的google阅读器主题)时,AppEngine可能无法处理所有条目。我的仪表板上有很多这样的CPU限制警告。但这可能会导致我无法优化代码

总的来说,AppEngine还不是lifestream应用程序的理想平台,但未来可能会发生变化。

(这显然很旧,只是因为它在相关的谷歌查询中仍然占据很高的位置才做出响应…)


我刚开始使用AppEngine,并没有在大量的外部请求中使用它。但我知道上面的信息现在可能不那么有效,甚至可能不再有效。自2008年9月以来,他们放宽了一些限制——因为他最初对上述内容以及后来的发展提出了投诉。

很抱歉,StackOverFlow不允许我发布多个链接,因为我是新来的。所以你需要谷歌出其余4个链接。