Java 使用Python脚本在GAE云数据存储中自动存储实体

Java 使用Python脚本在GAE云数据存储中自动存储实体,java,android,python,google-app-engine,csv,Java,Android,Python,Google App Engine,Csv,我已经编写了一个Python脚本,它可以从我们大学的HTML页面中获取我们需要的所有学位信息。它生成一个包含所有数据的.csv文件。然后使用API中的方法将.csv文件中的数据上载到数据存储 这是一个特别乏味的过程。由于我们只能发出少于一分钟的请求,因此需要将.csv文件分解为许多不同的位。显然,这并不酷 我们最初设想了一个数据库,它将使用我们的python脚本,每年更新/填充所有新的学位信息。与用Java编码的GAE云数据存储一起运行的python脚本 有可能这样做吗?我们能让数据库自我更新吗

我已经编写了一个Python脚本,它可以从我们大学的HTML页面中获取我们需要的所有学位信息。它生成一个包含所有数据的
.csv
文件。然后使用API中的方法将
.csv
文件中的数据上载到数据存储

这是一个特别乏味的过程。由于我们只能发出少于一分钟的请求,因此需要将
.csv
文件分解为许多不同的位。显然,这并不酷

我们最初设想了一个数据库,它将使用我们的python脚本,每年更新/填充所有新的学位信息。与用Java编码的GAE云数据存储一起运行的python脚本

有可能这样做吗?我们能让数据库自我更新吗

如果是这样的话,我们是否可以手动和自动实现


谢谢你的阅读

因此,基本上,您希望获取使用一个Python脚本创建的csv文件,然后使用另一个程序对其进行解析,并将该数据上载到数据存储,以便其他内容可以访问该文件

我看到了几个选项:

  • 使用拉队列。设置一个Appengine项目,该项目承载一个RESTful服务,您当前的Python脚本可以将CSV文件上载到该服务,应用程序处理/将其放入数据存储

  • 使用cron作业构建一个应用程序,该应用程序检查新CSV文件的特定位置,让原始Python脚本(或手动)将CSV文件放置到该特定文件夹中,并使用它。该应用程序还可以有一个页面,您可以手动上传CSV文件,这将为您提供自动和手动选项


  • 当然,每个任务的细节以及如何构建它们取决于您。

    看看有10分钟超时的任务或有更长限制的后端模块。据您所知,我们无法让数据库自动执行此操作?我认为您必须通过appengine项目才能与数据存储。如果您想让数据库自动与数据存储同步,我上面描述的第一个选项是最好的——让项目公开一些数据库可以连接到的API,或者一些会产生影响的API。再说一次,我不是专家,但这是我的建议。顺便说一句,在将数据放入数据存储后,您将如何处理这些数据?您是在处理它还是只是使用它向最终用户显示/运行查询?