Cluster computing SunGridEngine、Condor、Torque作为PVM的资源管理器

Cluster computing SunGridEngine、Condor、Torque作为PVM的资源管理器,cluster-computing,hpc,sungridengine,pvm,Cluster Computing,Hpc,Sungridengine,Pvm,有人知道哪种资源管理器适合PVM吗?或者我不应该使用PVM,而应该依赖MPI(或者它的任何版本,比如MPICH-2[还有其他更好的版本吗?])。使用PVM的主要原因是因为在我之前开始这个项目的人假设使用PVM。然而,现在这个项目是我的(他没有做任何重要的工作,依赖于PVM),这可以很容易地改变,最好是易于安装的东西,因为安装和设置PVM是一个大麻烦 我倾向于SunGridEngine,因为我有专用硬件,在阅读了另一篇关于哪些硬件更适合专用硬件的帖子后,SGE似乎是赢家。但是,我不确定它使用PVM

有人知道哪种资源管理器适合PVM吗?或者我不应该使用PVM,而应该依赖MPI(或者它的任何版本,比如MPICH-2[还有其他更好的版本吗?])。使用PVM的主要原因是因为在我之前开始这个项目的人假设使用PVM。然而,现在这个项目是我的(他没有做任何重要的工作,依赖于PVM),这可以很容易地改变,最好是易于安装的东西,因为安装和设置PVM是一个大麻烦

我倾向于SunGridEngine,因为我有专用硬件,在阅读了另一篇关于哪些硬件更适合专用硬件的帖子后,SGE似乎是赢家。但是,我不确定它使用PVM的性能。想知道是否有人有过PVM和SGE的经验

如果人们使用SGE,您使用什么在计算机与计算机(或虚拟机与虚拟机)之间进行通信

哦,如果这很重要,我将运行Perl应用程序/行

有什么建议或想法吗

提前感谢所有评论

  • 图格

我使用Torque、SGE和LSF在Linux系统上运行PVM,没有任何问题。您是否在问“是否可以使用SGE、Torque等来运行PVM应用程序?”

如果是这样,请查看下面的示例LinuxC-shell作业脚本。注意,除了每个脚本的头之外,脚本几乎是相同的,它符合每个资源管理器的适当格式

SGE作业脚本:

#!/bin/csh
#$ -N LTR-001
#$ -o LTR-001.output
#$ -e LTR-001.error
#$ -pe comp 24
#$ -l h_rt=04:00:00
#$ -A cmit2
#$ -cwd
#$ -V

# Setup envirnoment
setenv LD_LIBRARY_PATH /lfs0/projects/cmit2/opt-intel/overture-noX/lib:${LD_LIBRARY_PATH}
setenv PVM_ARCH LINUX
setenv PVM_ROOT /lfs0/projects/cmit2/opt-intel/pvm3
setenv PVM_BIN ${PVM_ROOT}/bin
setenv PVM_RSH /usr/bin/ssh
setenv MY_HOSTS pvm_hostfile

rm -f ~/.pvmprofile
env | grep PVM_ > ~/.pvmprofile

# Create file containing _unique_ host names.  Note that there are two possible sources of available hosts
sort -k 1,1 -u ${MACHINE_FILE} >! ${MY_HOSTS}

# Start PVM & add nodes
printf "%s\n%s\n" conf quit|${PVM_ROOT}/lib/pvm ${MY_HOSTS}
wait
sleep 2

#
# Run apps requiring PVM.
#

wait
# Exit PVM daemon
echo "reset" | $PVM_ROOT/lib/pvm
echo "halt" | $PVM_ROOT/lib/pvm
#!/bin/csh
#PBS -N LTR-001
#PBS -o LTR-001.output
#PBS -e LTR-001.error
#PBS -l nodes=3:ppn=8
#PBS -l walltime=04:00:00
#PBS -q compute
#PBS -d .

# Setup envirnoment
setenv LD_LIBRARY_PATH /users/ps14/opt-intel/overture/lib:${LD_LIBRARY_PATH}
setenv PVM_ARCH LINUX64
setenv PVM_ROOT /users/ps14/opt-intel/pvm3
setenv PVM_BIN ${PVM_ROOT}/bin
setenv PVM_RSH ${PVM_ROOT}/ssh
setenv MY_HOSTS pvm_hostfile

rm -f ~/.pvmprofile
env | grep PVM_ > ~/.pvmprofile

# Create file containing _unique_ host names.  Note that there are two possible sources of available hosts
sort -k 1,1 -u ${PBS_NODEFILE} >! ${MY_HOSTS}

# Start PVM & add nodes
printf "%s\n%s\n" conf quit|${PVM_ROOT}/lib/pvm ${MY_HOSTS}
wait
sleep 2

#
# Run apps requiring PVM.
#

wait
# Exit PVM daemon
echo "reset" | $PVM_ROOT/lib/pvm
echo "halt" | $PVM_ROOT/lib/pvm
扭矩作业脚本:

#!/bin/csh
#$ -N LTR-001
#$ -o LTR-001.output
#$ -e LTR-001.error
#$ -pe comp 24
#$ -l h_rt=04:00:00
#$ -A cmit2
#$ -cwd
#$ -V

# Setup envirnoment
setenv LD_LIBRARY_PATH /lfs0/projects/cmit2/opt-intel/overture-noX/lib:${LD_LIBRARY_PATH}
setenv PVM_ARCH LINUX
setenv PVM_ROOT /lfs0/projects/cmit2/opt-intel/pvm3
setenv PVM_BIN ${PVM_ROOT}/bin
setenv PVM_RSH /usr/bin/ssh
setenv MY_HOSTS pvm_hostfile

rm -f ~/.pvmprofile
env | grep PVM_ > ~/.pvmprofile

# Create file containing _unique_ host names.  Note that there are two possible sources of available hosts
sort -k 1,1 -u ${MACHINE_FILE} >! ${MY_HOSTS}

# Start PVM & add nodes
printf "%s\n%s\n" conf quit|${PVM_ROOT}/lib/pvm ${MY_HOSTS}
wait
sleep 2

#
# Run apps requiring PVM.
#

wait
# Exit PVM daemon
echo "reset" | $PVM_ROOT/lib/pvm
echo "halt" | $PVM_ROOT/lib/pvm
#!/bin/csh
#PBS -N LTR-001
#PBS -o LTR-001.output
#PBS -e LTR-001.error
#PBS -l nodes=3:ppn=8
#PBS -l walltime=04:00:00
#PBS -q compute
#PBS -d .

# Setup envirnoment
setenv LD_LIBRARY_PATH /users/ps14/opt-intel/overture/lib:${LD_LIBRARY_PATH}
setenv PVM_ARCH LINUX64
setenv PVM_ROOT /users/ps14/opt-intel/pvm3
setenv PVM_BIN ${PVM_ROOT}/bin
setenv PVM_RSH ${PVM_ROOT}/ssh
setenv MY_HOSTS pvm_hostfile

rm -f ~/.pvmprofile
env | grep PVM_ > ~/.pvmprofile

# Create file containing _unique_ host names.  Note that there are two possible sources of available hosts
sort -k 1,1 -u ${PBS_NODEFILE} >! ${MY_HOSTS}

# Start PVM & add nodes
printf "%s\n%s\n" conf quit|${PVM_ROOT}/lib/pvm ${MY_HOSTS}
wait
sleep 2

#
# Run apps requiring PVM.
#

wait
# Exit PVM daemon
echo "reset" | $PVM_ROOT/lib/pvm
echo "halt" | $PVM_ROOT/lib/pvm

是的,那是我的问题。谢谢但是对于使用哪种资源管理器有什么偏好吗?作为最终用户(不是系统管理员),我觉得两者几乎没有区别。