How to setup SGE
来自cslt Wiki
现在在cluster上部署的Grid Engine是Open Grid Scheduler。
目录
安装
安装方式
- 编译安装。获取源码包,当前最新版本2011.11p1。过程参考Compiling Open Grid Scheduler / Grid Engine from Source
- 使用预编译二进制安装包。在x86_64 linux且有X的情况下可使用 ge2011.11.tar.gz
master node
- 设置环境变量SGE_ROOT为上一步安装好的目录
- 运行安装脚本
-
- cd $SGE_ROOT
- ./install_qmaster
-
exec node
- 设置环境变量SGE_ROOT
- 将该节点加入到administrative hosts中
-
[master]$ qconf -ah <hostname of exec node>
-
- 运行安装脚本
-
- [exec]$ cd $SGE_ROOT
- ./install_execd
-
copy from other grid
- scp -r wolf01:/opt/sge /opt/sge
- cd /opt/sge
- ./install_execd
- cp redhat/common/settings.* /etc/profile.d/
- source /etc/profile.d/settings.sh
配置
可以使用图形界面工具qmon
环境变量
- 运行时引用
$SGE_ROOT/$SGE_CELL/common/settings.sh
default shell for queue
-
qconf -mq <QUEUE_NAME>
# 编辑配置,修改shell为/bin/bash
smp pe jobs
- SunGridEngine#Configure_a_parallel_environment
-
qconf -ap smp
pe_name smp slots 999 user_lists NONE xuser_lists NONE start_proc_args /bin/true stop_proc_args /bin/true allocation_rule $pe_slots # this forces all slots to be on the same host! control_slaves FALSE job_is_first_task TRUE urgency_slots min
-
qconf -mq <QUEUE_NAME>
# 编辑配置,把smp加入pe_list中