Sql server 数据库R服务中的SQLServer:如何使rxSummary正常工作?

Sql server 数据库R服务中的SQLServer:如何使rxSummary正常工作?,sql-server,r,Sql Server,R,我将尝试按照以下数据库R服务中的SQLServer教程进行操作: 但是,当我运行rxSummary操作时,我得到的不是预期的数据,而是以下内容: Call: rxSummary(formula = ~fare_amount:F(passenger_count, 1, 6), data = inDataSource) Summary Statistics Results for: ~fare_amount:F(passenger_count, 1, 6) Data: inDataSource

我将尝试按照以下数据库R服务中的SQLServer教程进行操作:

但是,当我运行rxSummary操作时,我得到的不是预期的数据,而是以下内容:

Call:
rxSummary(formula = ~fare_amount:F(passenger_count, 1, 6), data = inDataSource)

Summary Statistics Results for: ~fare_amount:F(passenger_count, 1,
6)
Data: inDataSource (RxSqlServerData Data Source)
Number of valid observations: 1000 

 Name                                Mean  StdDev    Min Max ValidObs
 fare_amount:F_passenger_count_1_6_T 5.952 0.4979397 5.5 6.5 1000    
 MissingObs
 0         

Statistics by category (6 categories):

 Category                                   F_passenger_count_1_6_T Means
 fare_amount for F(passenger_count,1,6,T)=1 1                       5.952
 fare_amount for F(passenger_count,1,6,T)=2 2                          NA
 fare_amount for F(passenger_count,1,6,T)=3 3                          NA
 fare_amount for F(passenger_count,1,6,T)=4 4                          NA
 fare_amount for F(passenger_count,1,6,T)=5 5                          NA
 fare_amount for F(passenger_count,1,6,T)=6 6                          NA
 StdDev    Min Max ValidObs
 0.4979397 5.5 6.5 1000    
    NA  NA  NA    0    
    NA  NA  NA    0    
    NA  NA  NA    0    
    NA  NA  NA    0    
    NA  NA  NA    0  
我知道实际数据正确地存在于数据库中,因为我可以选择乘客计数不是1的行

此外,在运行命令之后,DB机器有一个SQL Launchpad服务,该服务在大约10分钟内跳到100%的CPU使用率。在此期间,您无法查询数据库


发生了什么?

在本教程中,创建数据集的SQL select语句是错误的。它只选择前1000行,而那些恰好都有乘客计数为1的行。为了得到真正的结果,您必须选择每一行,或者通过选择子集并在末尾添加orderbynewid()来获得随机样本