2018年个人总结

目录

女儿的出生,生活从此变得和之前不一样。 拖到三月底还没有写成,去年的个人总结又一次可能泡汤了。 明天休完探亲假去上班,今天把之前写的整理下,做个简单的总结吧。

微风女神Aura

家里迎来一个新的生命,愿女儿健康快乐地成长。

山水甲天下

上半年去了日本,下半年去了桂林,都是风景秀美的地方。

第六年

移植

去年被系统移植和升级工作牵涉大量精力,自从同事离职后,原本其它部门负责的业务系统重新交给我们部门,而我事实上负责业务后处理系统的维护工作。 虽然同事在离职前已经完成大部分移植工作,后续的切换和升级还是让我深刻感受到系统建设和维护工作的困境。

系统建设实际上是个体力活,但想要方便地完成系统维护和升级,在构建系统时需要考虑多种因素。 移植的产品后处理系统就是个很典型的例子:系统中包含大量没有实际调用的脚本,这点其实和我们缺乏对运行脚本的版本管理有关系;大量紧耦合的任务放在同一个脚本中,某次更新就因为没有详细检查而导致数据出错。 为了系统的持续发展,需要对整个系统的流程和脚本进行重构。 问题就在这里,谁来干?

系统建设这种通常被认为缺乏创新点的工作需要花费大量时间,却很难成为为晋升增分的业绩。 在强调科研工作的单位里,投入-产出比太低,没有任何动力去做,除非有其他原因必须做这件事。 记得某次开会领导专门提到科研人员的时间更应该花在科学研究上,而不应该花在建业务系统这类事情上。 这就是我们部门后续发展所面临的最大问题,我们负责所有业务系统的建立和运维,随着业务运行的系统没有限制的增长,这部分工作会占用越来越多的时间和精力,留给能带来有效业绩工作的时间会越来越少。 去年阅读的一本书中给了我一定的启发,可以尝试宣传谁开发谁负责的观点,运维部门负责提供系统运行的工具,而不负责具体业务系统的建设。 虽然不会被接受,但就怕有万一,万一成了呢?

运维

去年工作中变化最大的一个方面就是业务系统运维面临更大的压力。 随着气象局大力推广GRAPES模式应用,我们的产品从无人问津变得用户逐渐增多,我们也面临着从保障系统稳定运行到保障产品按时分发的目标转换。 但无论是我们部门还是整个单位,都没有对运维目标的转换有足够的重视,仅仅认为保障业务运行是我们一个部门的职责,在工作计划中也没有投入足够的人力去研究如何更好地运维。 在系统迁移和用户增多的双重压力下,业务系统发生一次严重的事故,直接导致领导对我们整个部门的不信任,以及随之而来的一系列风波。 中间经历一系列的交锋,让我认识了自己,也认清了很多事情。 最终的结果是值班时长从1人1周改为1人3天,同时不再让其他部门单独值班。 不过,这仅仅是一个部门与领导双方妥协的临时方案,仅仅改变值班频次无法提高系统维护的水平,今年我们依然面临来自领导和系统本身的运维压力。

我一直认为单纯依靠人力无法提高运维水平,无论是强调工作态度,还是增加其他人手,对于受大量外界条件影响的数值预报业务系统来讲,都没有显著的效果。 经过多年的锻炼,我们的问题不在于解决故障的能力,而在于发现故障的速度。 影响产品分发的故障处理很多都是因为发现故障时间较晚,导致产品无法按时生成,因为模式积分耗时较长,而预报员对预报产品有时间要求,留给运维人员处理故障的只有有限的时间窗。

领导认为,我们没能按时发现故障是因为我们的责任心不强,对工作不够认真负责,所以期望通过引入更严格的考核机制,来区分每个值班人员的值班效果。 我个人完全反对这种没有正效果的措施,且不说所谓值班效果很难界定,这种方案完全忽视了对具体问题的分析,也严重打击值班人员的工作积极性。 还好,这项提议被暂时搁置了。 我在今年汛期前还还有机会实施自己的方案,即通过技术手段提高运维能力。
运维也需要开发工具,需要使用自动化工具来提高效率。 去年这部分工作没有被列入计划中,也就缺少动力去深入研究。 不过,随着各个工程项目逐渐实施,我们部门可以借助第三方公司来开发一些运维工具。 今年部门也明确将运维开发写入工作计划中,期望今年我们的运维水平能有显著的提升。

业务支撑

连续两年,我提出的监控方面任务都被拿掉,但去年还是花了大量精力去完成监控平台从IBM到PI上的迁移,并对工具进行一定的升级。 升级的部分包括重新设计的模型类,使用docker部署整个平台等。 另外还为ecFlow和slurm开发了一些维护工具。 去年基于图数据库开发了产品分发管理系统。

今年领导终于重视运维工具的开发,我们将借助工程项目的力量进一步开发业务支撑工具,争取形成一套完整的运行监控系统,而不是现在我开发的各种分散的工具。

研发支撑

缺乏明确的项目支持,去年诊断软件的开发基本处于搁置状态。 一直没有形成可以试用的版本,也导致开发五年没有成果。 我个人还是不太愿意做这个项目,没有把全部精力用来开发诊断软件平台。 今年如果还继续这样,就没有后续了。

项目管理

后半年领导将海洋工程中的一个项目交给我来管理,这才发现项目管理不是一件容易的事情。 我更擅长独立完成任务,缺乏团队合作意识,所以项目管理一塌糊涂。 今年需要大力借助工程项目的力量完成工作任务,所以这方面我还得继续加强。

技术开发

去年研究了 GRIB2 数据处理和 Matplotlib 绘图等技术,不再详细描述。

编程 v2018

可以看到 4 月到 5 月以及 10 月份基本没有什么编程。

重拾书本

后半年在上下班路途中看了几本书,感觉不错。今天继续加油。

展望新年

女儿健康成长,即是我的愿望。