Performance 监视StarCluster/Sun Grid引擎群集性能

Performance 监视StarCluster/Sun Grid引擎群集性能,performance,amazon-ec2,cluster-computing,sungridengine,starcluster,Performance,Amazon Ec2,Cluster Computing,Sungridengine,Starcluster,我对使用StarCluster和SGE有点陌生。我想知道监控“集群性能”的最佳实践是什么,即确定集群在某个时间单位内可以运行多少个特定作业。我熟悉qstat命令,但它只显示每个作业的状态。我想我的用例是提交X个作业,并知道完成X个作业需要多长时间。有没有一个简单的开箱即用的方法来做这件事,或者我必须写一个scipt来做 现在我正在为每个实例使用Ubuntu 12.04 多谢 这样一个简单的bash脚本+一个time命令就足够了 lines=999 while [ $lines -ne 0 ];

我对使用StarCluster和SGE有点陌生。我想知道监控“集群性能”的最佳实践是什么,即确定集群在某个时间单位内可以运行多少个特定作业。我熟悉qstat命令,但它只显示每个作业的状态。我想我的用例是提交X个作业,并知道完成X个作业需要多长时间。有没有一个简单的开箱即用的方法来做这件事,或者我必须写一个scipt来做

现在我正在为每个实例使用Ubuntu 12.04


多谢

这样一个简单的bash脚本+一个time命令就足够了

lines=999
while [ $lines -ne 0 ]; do
    sleep 1;
    lines=`qstat -u "*" | wc -l`;
    done;
只要队列不为空,此脚本就会循环。如果调用脚本“queue_watch.sh”,则启动作业,然后运行命令

time bash queue_watch.sh

这就够了。

你的问题我不太清楚。你想用这种监控做什么?根据“性能”添加和删除节点?如果是这样的话,您应该查看StarCluster loadbalance。只想简单地估计一组作业的执行时间,并尝试集群的不同配置,看看什么是最有效的。所以,我真的只是想给一系列的工作计时,并知道它们何时全部完成。谢谢