Sql server 数据库R服务中的SQLServer:如何使rxSummary正常工作?
我将尝试按照以下数据库R服务中的SQLServer教程进行操作: 但是,当我运行rxSummary操作时,我得到的不是预期的数据,而是以下内容:Sql server 数据库R服务中的SQLServer:如何使rxSummary正常工作?,sql-server,r,Sql Server,R,我将尝试按照以下数据库R服务中的SQLServer教程进行操作: 但是,当我运行rxSummary操作时,我得到的不是预期的数据,而是以下内容: Call: rxSummary(formula = ~fare_amount:F(passenger_count, 1, 6), data = inDataSource) Summary Statistics Results for: ~fare_amount:F(passenger_count, 1, 6) Data: inDataSource
Call:
rxSummary(formula = ~fare_amount:F(passenger_count, 1, 6), data = inDataSource)
Summary Statistics Results for: ~fare_amount:F(passenger_count, 1,
6)
Data: inDataSource (RxSqlServerData Data Source)
Number of valid observations: 1000
Name Mean StdDev Min Max ValidObs
fare_amount:F_passenger_count_1_6_T 5.952 0.4979397 5.5 6.5 1000
MissingObs
0
Statistics by category (6 categories):
Category F_passenger_count_1_6_T Means
fare_amount for F(passenger_count,1,6,T)=1 1 5.952
fare_amount for F(passenger_count,1,6,T)=2 2 NA
fare_amount for F(passenger_count,1,6,T)=3 3 NA
fare_amount for F(passenger_count,1,6,T)=4 4 NA
fare_amount for F(passenger_count,1,6,T)=5 5 NA
fare_amount for F(passenger_count,1,6,T)=6 6 NA
StdDev Min Max ValidObs
0.4979397 5.5 6.5 1000
NA NA NA 0
NA NA NA 0
NA NA NA 0
NA NA NA 0
NA NA NA 0
我知道实际数据正确地存在于数据库中,因为我可以选择乘客计数不是1的行
此外,在运行命令之后,DB机器有一个SQL Launchpad服务,该服务在大约10分钟内跳到100%的CPU使用率。在此期间,您无法查询数据库
发生了什么?在本教程中,创建数据集的SQL select语句是错误的。它只选择前1000行,而那些恰好都有乘客计数为1的行。为了得到真正的结果,您必须选择每一行,或者通过选择子集并在末尾添加orderbynewid()来获得随机样本