Snowflake cloud data platform snowflake可以作为一个可操作的数据存储,我可以根据它编写RESTAPI吗

Snowflake cloud data platform snowflake可以作为一个可操作的数据存储,我可以根据它编写RESTAPI吗,snowflake-cloud-data-platform,Snowflake Cloud Data Platform,我正在研究snowflake数据库,并有一个数据聚合用例,在这个用例中,我需要通过RESTAPI公开聚合的数据。虽然数据摄取和聚合似乎有很好的定义,但snowflake是一个可以用作高吞吐量API服务的操作数据存储的系统吗? 或者这是基于您最近的评论更新的系统的反模式 下面是我在生产中的大桌子上做的一些快速测试结果*更改了要显示的表名 vLookupView记录=175760316 vMainView记录=179035026 SELECT LP.REGIONCODE , SUM

我正在研究snowflake数据库,并有一个数据聚合用例,在这个用例中,我需要通过RESTAPI公开聚合的数据。虽然数据摄取和聚合似乎有很好的定义,但snowflake是一个可以用作高吞吐量API服务的操作数据存储的系统吗?
或者这是基于您最近的评论更新的系统的反模式

下面是我在生产中的大桌子上做的一些快速测试结果*更改了要显示的表名

vLookupView记录=175760316

vMainView记录=179035026

SELECT 
    LP.REGIONCODE
    , SUM(L.VALUE)    
FROM DBO.vLookupView AS LP
INNER JOIN DBO.vMainView AS M
    ON LP.PK = M.PK
GROUP BY LP.REGIONCODE;
结果:

SQL SERVER 
Production box - 2:04 minutes
**Snowflake:**
By Warehouse (compute) size
XS - 17.1 seconds
Small - 9.9 seconds
Medium - 7.1s seconds
Large - 5.4 seconds
Extra Large - 5.4 seconds
当我添加WHERE条件时

WHERE L.ENTEREDDATE BETWEEN '1/1/2018' AND '6/1/2018'
结果是:

SQL SERVER 
Production box - 5 seconds
**Snowflake:**
By Warehouse (compute) size
XS - 12.1 seconds
Small - 3.9 seconds
Medium - 3.1s seconds
Large - 3.1 seconds
Extra Large - 3.1 seconds

根据您最近的评论进行更新

下面是我在生产中的大桌子上做的一些快速测试结果*更改了要显示的表名

vLookupView记录=175760316

vMainView记录=179035026

SELECT 
    LP.REGIONCODE
    , SUM(L.VALUE)    
FROM DBO.vLookupView AS LP
INNER JOIN DBO.vMainView AS M
    ON LP.PK = M.PK
GROUP BY LP.REGIONCODE;
结果:

SQL SERVER 
Production box - 2:04 minutes
**Snowflake:**
By Warehouse (compute) size
XS - 17.1 seconds
Small - 9.9 seconds
Medium - 7.1s seconds
Large - 5.4 seconds
Extra Large - 5.4 seconds
当我添加WHERE条件时

WHERE L.ENTEREDDATE BETWEEN '1/1/2018' AND '6/1/2018'
结果是:

SQL SERVER 
Production box - 5 seconds
**Snowflake:**
By Warehouse (compute) size
XS - 12.1 seconds
Small - 3.9 seconds
Medium - 3.1s seconds
Large - 3.1 seconds
Extra Large - 3.1 seconds

您想通过Rest API向Snowflake读写事务,还是只在Snowflake中运行聚合查询?运行聚合查询读取结果集我在Snowflake上做了同样的事情,取得了巨大成功。我最初使用的是aws RDS,但对于数据量,它根本不起作用,因为雪花的速度非常快。还记得它是一个柱状数据库设计。因此,如果聚合列更少,效果更好。另一个需要考虑的重要部分是仓库类型取决于您的数量。Snowflake在这个用例中非常出色,因为它具有弹性和近乎无限的并发性。谢谢,您有任何查询计时结果可以共享吗?您想通过Rest API读写事务到Snowflake吗,或者只是在Snowflake中运行聚合查询?运行聚合查询读取结果集我在Snowflake上做了同样的事情,取得了巨大成功。我最初使用的是aws RDS,但对于数据量,它根本不起作用,因为雪花的速度非常快。还记得它是一个柱状数据库设计。因此,如果聚合列更少,效果更好。另一个需要考虑的重要部分是仓库类型取决于您的容量。Snowflake在这个用例中非常出色,因为它具有弹性和近乎无限的并发性。谢谢,您有任何查询计时结果可以共享吗?我将更多地关注数据读取类型的场景与数据加载/摄取。如果我在仓库中的多个表中有数据,并且我正在通过视图进行连接,那么对连接的数据进行点查找是否足够?如果你有任何计时结果,你可以分享great@vmurthy添加了一些快速测试结果,我可以分享。如果它是有用的,请考虑标记作为答案,否则,如果你有一些更具体的,我可以分享一些其他测试结果。这是伟大的。非常感谢您提供这些数据。您是否有任何结果表明,随着连接数量的增加,性能会如何?例如,我更关注的是数据读取类场景与数据加载/摄取。如果我在仓库中的多个表中有数据,并且我正在通过视图进行连接,那么对连接的数据进行点查找是否足够?如果你有任何计时结果,你可以分享great@vmurthy添加了一些快速测试结果,我可以分享。如果它是有用的,请考虑标记作为答案,否则,如果你有一些更具体的,我可以分享一些其他测试结果。这是伟大的。非常感谢您提供这些数据。您是否有任何结果显示,例如,随着连接数的增加,性能会如何