基于PostgreSQL的机器学习
如前所述,我对直接在PostgreSQL内部运行机器学习算法感兴趣 本文的基本要点是,我把我的算法写成一个函数,它给出了第n个模型基于PostgreSQL的机器学习,postgresql,optimization,machine-learning,bigdata,sparse-matrix,Postgresql,Optimization,Machine Learning,Bigdata,Sparse Matrix,如前所述,我对直接在PostgreSQL内部运行机器学习算法感兴趣 本文的基本要点是,我把我的算法写成一个函数,它给出了第n个模型 def get_model(n): return make_step(model(n-1)) def make_step(model): # Compute gradient and make update and return new model 其思想是数据库将优化数据流,以便查询运行得非常快 我的数据大约是10^12个样本,10^9个特征,每个
def get_model(n):
return make_step(model(n-1))
def make_step(model):
# Compute gradient and make update and return new model
其思想是数据库将优化数据流,以便查询运行得非常快
我的数据大约是10^12个样本,10^9个特征,每个样本平均有1000个特征不是零(高度稀疏)
我证明我的问题是正确的,因为我发现
- 我非常确信PostgreSQL可以被分发到许多机器上
- PostgreSQL处理稀疏矩阵向量积的能力如何
- PostgreSQL真的会优化数据流和处理吗
- 我的任何假设或其他目标都不现实吗