Note/ 多大的集合可以刻画预测分布?
Published:
Asymptotic scaling of ensemble size: identify how the sampling uncertainty of statistical quantities converges with ensemble size
Theory
不同moment和quantile的采样不确定性都遵从 ~√N(中心极限定理)
- quantile的不确定性还有另一项约束:~1/√p(1-p),对rare events大幅增长(Fig 1)
- Leutbecher(2019):提出skill如何随ensemble增长的理论框架:CRPS或其他不涉及rare events的分数 ~ √1+1/n
Craig22
Craig, G. C. et al. Distributions and convergence of forecast variables in a 1,000-member convection-permitting ensemble. Quarterly Journal of the Royal Meteorological Society 148, 2325–2343 (2022).
提出分布形状随lead变化的概念模型
- 初始不确定性(高斯,较小)– error growth(中小尺度先饱和?) –> 扩大、非高斯(可能多模态或偏态)的分布 – unpredictable regime transition / memory decay –> 宽而平滑的气候态分布
- nesting模式的不确定性:收到驱动的全球模式限制,forcing弱时model physics才会占主导
- S2S尺度的variability受到快变天气过程的影响,可能掩盖可预测性的影响
- 分布都可以分为三种:准高斯、偏态、多模态分布
用1k个集合成员的3km对流允许模式检验(Necker的现有数据集)
- 各个统计量的置信区间确实follow √N 的 scaling;
- 1000个成员数量对绝大多数统计量都够用,除了极端降水
- 空间平均/邻域平均:只对降水这类变量的预测准确性有提升效果(Fig10,降水的neiborhood分布较窄)
Tempest22
Tempest, K. I., Craig, G. C. & Brehmer, J. R. Convergence of forecast distributions in a 100,000-member idealised convective-scale ensemble. Quarterly Journal of the Royal Meteorological Society 149, 677–702 (2023).
- 一个一维的理想积云对流模式,计算成本小,可以做1e6个成员
模式可以模拟非高斯和间歇特性
- (风速分布介于laplacian和Gaussian之间,高度场分布是bimodal的)
- bootstrap来给出采样不确定性
对√n的scaling拟合:Fig7-9,mean、var拟合是非常好的,quantile的拟合在样本较少时更容易失效,例如到0.95开始不准;
而对于bimodal的低点也有着不好的拟合
quantile对于~1/√p(1-p)也有较好的拟合