Introduction for HPC in BUCT
写在前面
官方网站: http://hpc.buct.edu.cn
作业管理系统: IBM Platform LSF
更多帮助文档可参考上交的超算中心文档,但有些咱学校未必能适用。
清华HPC手册下载
目前qtest
及以上的队列可用,qtest
免费,qtest
以上队列收费
登陆
登陆可参照SSH简易使用
命令
最常用
提交作业,COMMAND 加引号是为了防止命令内>
重定向错误
1 | $ bsub -q QUEUE -n Z -i INPUTFILE -o %J.out -e %J.err "COMMAND" |
特殊情况下需要指定host_name来避免单节点内存压力太大。
如串行的SVseq2需要读入参考基因组3G,节点的内存为6*4G,有的节点可以同时运行8、12、甚至20个作业,一旦作业使用内存超过24G,效率就会降低。
1 | $ bsub -m host_name …… |
查看作业
1 | $ bjobs |
查看队列
1 | $ bqueue |
杀死作业
1 | $ bkill JOBID |
添加~/bin/bkillall
如下,可使用该命令杀死当前用户所有作业(输错命令时使用,慎用,会杀掉别人在该用户下提交的作业)
1 |
|
查看标准输出(stderr/stdout)
1 | $ bpeek |
可在.bashrc里面加入如下,方便简单调用
1 | alias bq='bqueues' |
一般常用
- bhist: 查看历史作业信息
- bhosts: 查看计算节点
不怎么用
busers/bmod/bstop/bresume/qdel/qstat……
FAQ
- 杀死僵尸进程:
bkill -r JOBID
- 查看作业标准输出(一直查看),home目录下有
.lsbatch
目录,找到对应以JOBID.out
结尾的文件,然后tail -f $outfile
即可