0%

Introduction for HPC in BUCT

Introduction for HPC in BUCT

写在前面

官方网站: http://hpc.buct.edu.cn
作业管理系统: IBM Platform LSF
更多帮助文档可参考上交的超算中心文档,但有些咱学校未必能适用。
清华HPC手册下载
目前qtest及以上的队列可用,qtest免费,qtest以上队列收费

登陆

登陆可参照SSH简易使用

命令

最常用

提交作业,COMMAND 加引号是为了防止命令内>重定向错误

1
$ bsub -q QUEUE -n Z -i INPUTFILE -o %J.out -e %J.err "COMMAND"

特殊情况下需要指定host_name来避免单节点内存压力太大。
如串行的SVseq2需要读入参考基因组3G,节点的内存为6*4G,有的节点可以同时运行8、12、甚至20个作业,一旦作业使用内存超过24G,效率就会降低。

1
$ bsub -m host_name ……

查看作业

1
2
$ bjobs
$ bjobs -a -l

查看队列

1
2
$ bqueue
$ bqueue qtest

杀死作业

1
$ bkill JOBID

添加~/bin/bkillall如下,可使用该命令杀死当前用户所有作业(输错命令时使用,慎用,会杀掉别人在该用户下提交的作业)

1
2
#!/bin/bash
bkill `bjobs | grep ^[0-9] | awk '{print $1}' `

查看标准输出(stderr/stdout)

1
2
$ bpeek
$ bpeek JOBID

可在.bashrc里面加入如下,方便简单调用

1
2
3
alias bq='bqueues'
alias bs='bsub'
alias bj='bjobs'

一般常用

  • bhist: 查看历史作业信息
  • bhosts: 查看计算节点

不怎么用

busers/bmod/bstop/bresume/qdel/qstat……

FAQ

  1. 杀死僵尸进程: bkill -r JOBID
  2. 查看作业标准输出(一直查看),home目录下有.lsbatch目录,找到对应以JOBID.out结尾的文件,然后tail -f $outfile即可