数值预报模式不同时次运行时长是否相同?

目录

数值天气预报模式业务系统每天会运行多个时次,及时向预报员提供最新的预报结果。 大部分系统不同时次之间除了输入数据外,没有显著的区别。 那么,不同时次模式积分的运行时长是否相同呢?

本文尝试使用多种方法回答这一问题。

数据

GRAPES 模式积分程序在日志中输出单步积分耗时,所有单步耗时累加可以得到模式积分总体耗时。

下面是 GRAPES MESO 3KM 模式积分程序输出的时间步长信息,使用正则表达式提取积分步数和单步积分时长。

Timing for processing for step 3901 (2021020911:44:21):          0.74780 elapsed seconds.
Timing for processing for step 3901 (2021020911:44:21):          0.74756 cpu seconds.
 begin of gcr  9.699100979868703E-006
 RES of gcr  9.787437371783738E-013 in           21 iterations 

详细提取方法请查看如下文章:

NWPC笔记:获取模式积分时长 - 恒定步长

NWPC笔记:获取模式积分时长 - 动态步长

本文使用 2020 年 8 月 1 日至 11 月 30 日 GRAPES GFS,GRAPES MESO 3KM 和 GRAPES TYM 三个业务系统的模式积分程序输出日志。 数据来自 NWPC 业务系统备份目录,少量时次的日志有缺失。

方法

使用方差分析和置换检验分析不同时次的运行时间是否相同。 使用自助法计算运行均值 95% 置信区间。 比较原始数据和重采样数据的分布。

本文所有计算和绘图结果均使用 R 语言实现,其中:

  • 直方图、箱线图和频率图由 ggplot2 包绘制
  • 均值与置信区间图使用 gplots 包中的 plotmeans() 函数绘制
  • 单因素方差分析使用 aov() 函数
  • 两样本/K样本置换检验使用 coin 库中的 oneway_test() 函数
  • 置信区间使用 boot 库计算
  • Tukey HSD 检验使用 TukeyHSD() 函数计算,其中一幅图形由 multcomp 包绘制

结果分析

对 GRAEPS GFS,GRAPES MESO 3KM 和 GRAPES TYM 三个模式分别进行分析。

注:以下数据时间单位均为分钟。

GRAPES GFS

GRAPES GFS 系统 00 和 12 两个时次积分 240 小时。

描述性分析

均值与标准差
时次均值标准差
0038.988483.328998
1238.405605.343417

从上述结果可以看到,两个时次的运行时长均值几乎相同,但 12 时次的标准差较大,说明 12 时次运行时长波动较大。

分布图

原始数据

对于原始数据,12 时次运行时长偏少,但运行时长偏大的离群点比 00 时次多。

重采样数据

对于重采样数据,12 时次比 00 时次分布更广,但两者相差 2 分钟左右,可以忽略不计。

均值和置信区间

同样可以看到,GRAPES GFS 两个时次的运行时间均值相差很小。

方差分析与置换检验

对 00 和 12 两个时次进行分析

方法p 值
单因素方差分析0.307
两样本置换检验0.3115

两种检验结果均不显著,说明 00 和 12 两个时次运行时长没有区别。

置信区间

两个时次运行时长均值的置信区间如下:

时次下界上界
0038.4175339.59852
1237.5688939.47753

从均值置信区间上也可以看到,两个时次运行时长几乎相同,但 12 时次置信区间略大。

结论

从上述分析可以看到,GRAPES GFS 00 和 12 时次运行时长没有显著区别。

GRAPES MESO 3KM

GRAPES MESO 3KM 一天运行 8 次,每次积分 36 小时。

描述性分析

均值与标准差
时次均值标准差
0067.785046.806254
0364.756085.809834
0664.512045.189582
0965.870469.300791
1267.971979.732788
1565.339087.690270
1864.068455.797037
2164.637066.050846

从上述结果可以看到,8 个时次均值分为三类,00、12 比其余时次均值略大,09、15 属于第二梯队。 与 GRAPES GFS 相似,09、12 和 15 时次标准差较大,时长波动较大。

分布图

原始数据

从直方图和箱线图可以看到,00、12 时次与其余时次有明显的差异,另外 09、12、15 时次运行时长偏长的离群点比较多。

重采样数据

对于重采样数据,可以看到 00、12 时次均值明显大于其它时次,09、15 时次比其余 4 个时次均值略大。

均值和置信区间

与均值和标准差的结果一致,00、12 与其它时次均值不同,09、15 时次也和其余时次有所区别。

方差分析与置换检验

对所有 8 个时次进行分析:

方法p 值
单因素方差分析7.93e-06
K 样本置换检验< 1e-04

两种检验结果均显著,说明至少一个时次运行时长与其它时次不同。

使用 Tukey HSD 检验 进行进一步分析

各个时次逐对比较,置信区间包含零说明差异不显著

用另一种方式对比各时次间的差异,有相同字母的组说明均值差异不显著。

可以看到 03/06/09/15/18/21 分为一组,00/09/12/15分为一组。

置信区间

8 个时次运行时长均值的置信区间如下:

时次下界上界
0066.6608969.1019
0363.804365.87745
0663.6003765.4604
0964.4245567.57517
1266.5200169.92443
1564.0855566.72582
1863.0748665.22094
2163.640865.70772

从均值置信区间上也可以看到,00、12 时次运行时长较长,09、15 时次紧随其后,这 4 个时次的置信区间比其余 4 个时次略大。

结论

从上述分析可以看到,GRAPES MESO 3KM 运行时长不完全相同,其中 00、12 时次明显大于其余时次,09、15 时次也与其余 4 个时次不同。

因为 MESO 3KM 的 00、12 时次是冷启动,其余时次是暖启动,运行时长偏长可能与此相关。 而 09、15 时次偏长可能与 GFS 12 时次波动较大类似,不是因模式本身导致的。

GRAPES TYM

GRAPES TYM 一天运行 4 次,每次积分 120 小时。

描述性分析

均值与标准差
时次均值标准差
0062.893867.302026
0658.786705.485594
1262.9346311.107283
1858.581103.177714

从上述结果可以看到,四个时次均值明显分为两类,00、12 时次比 06、18 时次均值略大。 与 GRAPES GFS 相似,12 时次标准差最大,时长波动最大。

分布图

原始数据

从直方图和箱线图可以看到,00、12 时次与 06、18 时次有明显的差异,12 时次运行时长偏长的离群点比较多。

重采样数据

对于重采样数据,可以看到 00、12 时次均值明显大于其它时次,12 时次离群点较多。

均值和置信区间

与均值和标准差的结果一致,00、12 时次与 06、18 时次均值不同, 12 时次置信区间最大。

方差分析与置换检验

对所有 4 个时次进行分析:

方法p 值
单因素方差分析2.19e-08
K 样本置换检验< 1e-04

两种检验结果均显著,说明至少一个时次运行时长与其它时次不同。

使用 Tukey HSD 检验 进行进一步分析

各个时次逐对比较,置信区间包含零说明差异不显著。

用另一种方式对比各时次间的差异,有相同字母的组说明均值差异不显著。

同样可以看到 00、12 与 06、18 组内没有差异但组间有区别。

置信区间

4 个时次运行时长均值的置信区间如下:

时次下界上界
0061.7594464.40769
0657.8299559.83561
1261.2624465.03094
1858.0653859.1961

从均值置信区间上也可以看到,00、12 时次运行时长较长,12 时次的置信区间最大。

结论

从上述分析可以看到,GRAPES TYM 运行时长不完全相同,其中 00、12 时次明显大于其余时次,12 时次运行时长波动最大。

总结

本文对 GRAPES GFS,GRAPES MESO 3KM 和 GRAPES TYM 三个业务系统的模式积分时长进行分析,得出以下结论:

  • GRAPES GFS 模式 00、12 两个时次运行时长没有区别;
  • GRAPES MESO 3KM 模式和 GRAPES TYM 模式的 00、12 两个时次运行时长偏长;
  • 凌晨附近时次(包括各系统的 12 时次和 MESO 3KM 的 09、15 时次)运行时长的波动比较大,具体原因有待进一步研究。

笔者仅为统计学的初学者,得到的分析结果可能不够准确,后续会继续研究。

参考

模式积分日志介绍

NWPC笔记:获取模式积分时长 - 恒定步长

NWPC笔记:获取模式积分时长 - 动态步长

R 语言分析方法介绍

R 语言实战:方差分析

R 语言实战:中级绘图

R 语言实战:重抽样与自助法