SMS学习笔记2 运行SMS

目录

SMS是由ECMWF开发的作业调度系统,现在已更新为ecFlow,单位继续使用老版的SMS,所以我还没接触ecFlow。

2.1 作业的状态
每个任务、作业族、作业包都有各自的状态,是我们最关注的信息。

unkown

complete

queued

submitted

active

suspended

aborted

Shutdown

Halted

SMS脚本中可以发送如下消息:

smsevent

smsmeter

smslabel

smsmsg

smsmail

2.2 作业包与作业族的状态(suite and family)
最重要的状态,参照2.1节从上到下重要性逐渐增大。
特有的两种状态
Shutdown
Halt
2.3 多个SMS在同一个服务器运行
用不同SMS_PROG变量区分。
2.4 停止SMS服务
halt->check point -> terminate
2.5 存盘 check point
smsping host 测试sms server是否在运行
2.6 启动文件
在环境变量或配置文件中定义(如教程中给的head.h)。
工作目录 SMSHOME
2.6.1 日志文件 SMSLOG
比较大,我手头某实例的日志文件就有300多M。日志种类有:
MSG   由用户产生 # MSG:[00:32:39 27.4.2007] login:User grape_qu@1 with password from p10n01
LOG   由tasks或sms产生 # LOG:[00:48:06 27.4.2007] meter:/grapes_wm_2_0/grapes/00/model/fcst:steps to 125
ERR  错误 # ERR:[07:08:20 7.6.2007] SMS-FILE-READ2: /pgpfs/fs1/grape_qu/SMSOUT/test4yn/grapes/00/an/an_3dv.2:file was not found:
WAR 警告 # WAR:[00:03:17 12.7.2007] login:user operator password ignored
DBG 调试信息,通常不可见
others 键盘的回显

# WAR:[10:03:45 28.3.2011] catch-check:[15] prepearing emergency checkpoint
check emergency
# MSG:[02:52:04 6.4.2011] sms:EOF in stdin, removing keyboard access

语法:
# XXX:[HH:MM:SS D.M.YYYY] command:fullname [+additional information]
2.6.2 checkpoint file 存盘文件
用XDR格式保存的二进制文件,用MD5检验合法性。先将之前文件保存到OLD,再写新的文件。
SMSAUTORECOVER 自动恢复
SMSCHECK
SMSCHECKOLD
2.7 安全性
2.7.1 白名单:区分全部权限和只读权限(以-开始)
SMSLISTS

4.3.20
#
# users which can modify things in SMS
#
grape_qu
#
#  Users who can only look at things, but not issue commands
#
-nwp
-operator

命令行中的更新: CDP>sms readlists
2.7.2 密码文件
SMSPASSWD  XDR的二进制文件,手头没有实例
2.8 输出
2.8.1 标准输出和标准错误输出:通过shell重定向修改
2.8.2 sms log server
高级主题,还未接触