HPC系统使用指南

研发部(2011年06月7日)

基本使用

作业提交

串行作业

用bsub命令

$ bsub –q normal -o %J.out  myJob

其中myJob必须是作业的全路径。输出文件名为jobid。

 

并行作业

用bsub命令

$ bsub -n 16 -o %J.out  mpijob ./myjob

-n后跟使用的cpu个数。

 

指定作业运行机

用bsub命令

$ bsub -m "xm1 xm2 xm3" n 16 -o %J.out  mpijob ./myjob

将该任务限定在xm1 xm2 xm3上运行

 

作业监视

  • bjobs检查提交作业状态
$ bjobs
  • bhist 显示最近完成作业或正在运行作业的历史情况
$ bhist <jobid>
  • bkill 删除不需要的作业
$ bkill <jobid>
$ bkill –r <jobid>
  • bpeek 当作业正在运行时显示它的标准输出,监视作业运行
$ bpeek <jobid>

 

相关命令

  • bqueues 显示队列信息
$ bqueues 
$ bqueues –l <queue name>
  • bhosts 显示各节点作业相关情况
$ bhosts
$ bhosts <hostname>
  • lsload 显示各节点负载信息
$ lsload 
$ lsload <hostname>
  • lshosts处理各节点静态资源信息
$ lshosts
$ lshosts <hostaname>

使用规定

系统有独立的记录服务器自动通过网络将用户的登录及执行命令的情况加以记录和审计.计算服务器出于方便用户进行科研工作的目的,给予了各用户相对较高级别的应用执行权限.

我们希望本系统的用户能爱惜计算资源,尊重其他用户的计算权利,严格遵守以下计算服务器的使用规定

1.只在计算服务集群上运行与申请帐户时填写的科研项目有关的计算程序。

2.只使用LSF平台提交计算任务。

3.勿恶意抢占计算和存储资源。

4.勿试图进入或干扰其它用户的计算任务。

5.勿试图破解其他用户的密码。

6.勿进行其它任何试图攻击和破坏本系统的行为。

违反使用规定的用户可能被谢绝使用本系统,如对系统或其它用户的计算任务造成损失,应承担相应的赔偿责任。