Linux 为什么kmeans在高规格的Ubuntu机器上速度如此之慢,而不是在Windows上?

Linux 为什么kmeans在高规格的Ubuntu机器上速度如此之慢,而不是在Windows上?,linux,r,performance,ubuntu,cpu-speed,Linux,R,Performance,Ubuntu,Cpu Speed,我的Ubuntu机器的性能对于Rkmeans{stats}来说非常糟糕,而Windows7没有显示任何问题 X是一个5000 X 5的矩阵(数值变量)。 k=6 我的台式机是Intel Xeon CPU W3530@2.80GHz x 8(即8核)Dell Precision T3500,带有Ubuntu 12.04.4 LTS(GNU/Linux 3.2.0-58-generic x86_64)和24 GB RAM R版本3.0.2(2013-09-25)-“飞盘航行”版权所有(C)2013

我的Ubuntu机器的性能对于R
kmeans
{stats}来说非常糟糕,而Windows7没有显示任何问题

X
是一个5000 X 5的矩阵(数值变量)。
k
=6

我的台式机是Intel Xeon CPU W3530@2.80GHz x 8(即8核)Dell Precision T3500,带有Ubuntu 12.04.4 LTS(GNU/Linux 3.2.0-58-generic x86_64)和24 GB RAM

R版本3.0.2(2013-09-25)-“飞盘航行”版权所有(C)2013 统计计算平台R基金会: x86_64-pc-linux-gnu(64位)

我的结果(ubuntu机器):

Windows计算机:

> print(el.time)
 [1] 0.01 0.12 0.14 0.19 0.20 0.21 0.22 0.25 0.28 0.30

你在虚拟机上运行Ubuntu吗?如果是这样的话,我可以看到结果会慢得多——这取决于为VM分配了多少内存、处理器和磁盘空间。如果它没有在虚拟机中运行,那么结果令人费解。我想在运行时查看两个系统上每次运行的性能计数器(cpu使用率、内存使用率等是多少)?否则,我唯一可以链接的是,代码“适合”windows系统的一级缓存,但不适合Linux系统。Xeon有8GB(L3?)缓存,而Core i5只有3MB——但我假设这是L3。我不知道一级和二级缓存结构是什么样子。

我猜这是BLAS的问题。如果这样编译,R可能会使用内部BLAS。除此之外,不同的BLAS版本可能会显示出显著的性能差异()。

根据您的#抱歉的评论:sapply(1:n,function(i)system.time(kmeans(X,centers=k,nstart=i))[[3]]),而不是for循环。请注意,不会有任何性能提升,因为这基本上是相同的。另外,您对Windows机器的结果是什么?在Ubuntu上,我的Windows时间与你的相近。谢谢@tonytonov。周一回到我的办公桌时,我将更新Windows的时间安排。@A不同的是,我的Ubuntu 12.04虚拟机上的时间安排与您显示的数量级相同。我怀疑你的Ubuntu机器内存不足,开始交换。我注意到你的ubuntu R是3.0.2,而windows是3.0.1。kmeans函数是,在我的测试中,比上一个版本慢了大约20%。这还不足以解释您看到的差异,但我认为值得一提。不,这是基于磁盘的安装。我也不知道缓存,甚至不知道它们对这个问题意味着什么!我认为@ping有到目前为止最好的线索。我最近确实更新了我的安装,但我还没有回来检查这段代码。将在返回工作时很快更新。
> system.time(X.km <- kmeans(X, centers=k, nstart=25))

   user  system elapsed
   0.36    0.00    0.37
set.seed(101)
k <- 6
n <- as.integer(10)
el.time <- vector(length=n)
X <- matrix(rnorm(25000, mean=0.5, sd=1), ncol=5)
for (i in 1:n) {  # sorry, not clever enough to vectorise
    el.time[i] <- system.time(kmeans(X, centers=k, nstart=i))[[3]]
}
print(el.time)
plot(el.time, type="b")
> print(el.time)  
  [1] 0.056 0.243 0.288 0.489 0.510 0.572 0.623 0.707 0.830 0.846
> print(el.time)
 [1] 0.01 0.12 0.14 0.19 0.20 0.21 0.22 0.25 0.28 0.30