Note/ 多大的集合可以刻画预测分布?

Published:

Asymptotic scaling of ensemble size: identify how the sampling uncertainty of statistical quantities converges with ensemble size

Theory

不同moment和quantile的采样不确定性都遵从 ~√N(中心极限定理)

  • quantile的不确定性还有另一项约束:~1/√p(1-p),对rare events大幅增长(Fig 1)
  • Leutbecher(2019):提出skill如何随ensemble增长的理论框架:CRPS或其他不涉及rare events的分数 ~ √1+1/n

Craig22

Craig, G. C. et al. Distributions and convergence of forecast variables in a 1,000-member convection-permitting ensemble. Quarterly Journal of the Royal Meteorological Society 148, 2325–2343 (2022).

  • 提出分布形状随lead变化的概念模型

    • 初始不确定性(高斯,较小)– error growth(中小尺度先饱和?) –> 扩大、非高斯(可能多模态或偏态)的分布 – unpredictable regime transition / memory decay –> 宽而平滑的气候态分布
  • nesting模式的不确定性:收到驱动的全球模式限制,forcing弱时model physics才会占主导
  • S2S尺度的variability受到快变天气过程的影响,可能掩盖可预测性的影响
  • 分布都可以分为三种:准高斯、偏态、多模态分布
  • 用1k个集合成员的3km对流允许模式检验(Necker的现有数据集)

    • 各个统计量的置信区间确实follow √N 的 scaling;
  • 1000个成员数量对绝大多数统计量都够用,除了极端降水
  • 空间平均/邻域平均:只对降水这类变量的预测准确性有提升效果(Fig10,降水的neiborhood分布较窄)

Tempest22

Tempest, K. I., Craig, G. C. & Brehmer, J. R. Convergence of forecast distributions in a 100,000-member idealised convective-scale ensemble. Quarterly Journal of the Royal Meteorological Society 149, 677–702 (2023).

  • 一个一维的理想积云对流模式,计算成本小,可以做1e6个成员
  • 模式可以模拟非高斯和间歇特性

    • (风速分布介于laplacian和Gaussian之间,高度场分布是bimodal的)
  • bootstrap来给出采样不确定性
  • 对√n的scaling拟合:Fig7-9,mean、var拟合是非常好的,quantile的拟合在样本较少时更容易失效,例如到0.95开始不准;

    而对于bimodal的低点也有着不好的拟合

    quantile对于~1/√p(1-p)也有较好的拟合