Page 93 - 《华中农业大学学报（社会科学版）》2021年第5期

P. 93

第５期吴培等: 基于 C ( n ) ＧMIDAS模型的中国鸡蛋价格混频预测预警研究８７

趋势影响、消除不同变量具有不同量纲不同统计口径的差异化影响, 本研究将所有变量转化为波动率
、
进行分析, 即若 P t P t－１分别表示第t 、 t－１期的鸡蛋价格, 则鸡蛋价格波动率可表示为R t ＝ln
)
( P t －ln ( P t－１ ).
３．建模的关键环节
( １ ) 变量选择.本研究梳理了１８个影响国内鸡蛋价格变动的因素( 日、周、月、年度混合数据).
１８个变量如果全部纳入模型, 可能会存在次要影响因素预测效果较差进而影响全局的情况, 因此如
何从众多影响因素中选择主要的影响因素进行建模预测至关重要.根据研究目的, 变量选择一般可
以分为两类, 一是基于预测, 主要从时间先后变化方面考虑, 常用方法有时差相关分析、 K－L 信息量
分析和峰谷对应分析等, 如刘汉等将２１个月度景气指标分为先行指标、一致指标和滞后指标３组, 并
基于此分别构建３个模型预测季度 GDP , 结果显示, 先行指标组模型预测效果总体上好于其他两
组 [ ２５ ] ; 二是基于影响程度, 主要考虑自变量对因变量的贡献率, 常用方法有逐步回归、 Lasso 回归、遗
传算法、 VIP ( 变量投影重要性) 技术等 [ ２６ ] .实际研究中, 亦有学者综合多种变量选择方法进行变量筛
选, 从而更好地实现稀疏变量的主要信息提取, 如刘小瑜等结合 Lasso 和 VIP 方法从２１个变量中筛
选出６个重要因素, 构建出口商品价格总指数预测模型具有良好的预测效果 [ ２６ ] ; 袁铭通过连续小波
变换后利用 FCM 算法进行变量选择 [ ２７ ] .本文以预测为研究目的, 拟先运用时差相关分析筛选出具
有较好预测意义的先行指标, 同时考虑到不同指标对鸡蛋价格波动的影响不同, 相关度、贡献率较小
的先行指标并不会给预测带来明显改善, 将进一步运用 VIP 技术探讨各自变量对因变量的贡献度,
尽可能地提取主要影响因素.
时差相关分析是利用相关系数验证解释变量和被解释变量之间先行、一致、滞后关系的常用方
法.确定最大延迟数后计算所有不同延迟数的时差相关系数, 绝对值最大的时差相关系数对应的延
迟数就是超前或滞后期, 认为此时解释变量和被解释变量之间的波动最接近.时差相关系数r 的表

达式如下:
n l －－
( x t ＋ l －x )( y t －y )
∑ t ＝ t′ １l ≥０
l＝０ , ±１ , ±２ ,, ±L , t′＝ { } ( ２ )
r＝
n l － n l －２１－ l l ＜０
y t －y
( x t ＋ l －x ) ２ ( )
∑ t ＝ t′ ∑ t ＝ t′
y 是变量个数.
式( ２ ) 中: 为解释变量, x 为被解释变量, l 表示先导或滞后期, L 是最大延迟数, n l
VIP 技术是基于偏最小二乘回归的一种变量选择方法, 通过相关自变量综合的主成分描述自变
量对因变量的解释能力, 并根据解释能力的大小筛选变量. VIP 表达式为:
m
k
２
y
)
VIP ＝ m ∑ r ( , C h W h j ２ ( ３ )
h＝１
２ )
y
∑ r ( , C h
h＝１
y ) 为因变量和主成分的相关系
式( ３ ) 中: k 为自变量个数, C h 为相关自变量提取的主成分, r ( , C h
为自变量在主成分上的权重.
数, W h j
传递, 故其 VIP 值可以反映自变量对模型拟合的重
自变量对因变量的解释作用通过主成分 C h
要程度, 通常认为VIP 值小于０．８的自变量对因变量的贡献较小, 可以考虑剔除 [ ２８ ] .
( ２ ) 权重函数选择. C ( n ) ＧMIDAS 模型回归估计的第二个关键问题是确定权重函数( 主要有 BeＧ
ta权重函数、 BetaＧNonＧZero 权重函数、 Almon权重函数、指数 Almon 权重函数、 ste p 权重函数和无
约束权重函数６种形式) 和预测方法( 主要是 Fixedwindow 、 Rollin g window 和 Recursive 等方法).
诸多学者建模前均对上述６种权重函数及３种预测方法进行了比较分析, 各权重函数在多项式构建、
波动分析、估计预测方面没有显著性差别 [ ２９ ] , 其中 Beta 、 Almon 、指数 Almon 权重运用最为广泛, 预
测效果普遍较好 [ ３０ ] ; ３种预测方法的原理都是比较计算预测值和实际值的误差, 其中, Fixedwindow
是在样本内取固定长度区间进行估计, Rollin g window 是设定一个长度进行滚动回归, Recursive是
在初始样本时窗长度基础上, 每向前预测一期就对时窗长度进行扩展, 预测效果差别不大 [ ３１ ] .本文
、无限制)、两参数指数 Almon 权重函数( θ １ ≤
将综合探讨两参数 Beta ( Gamma 分布函数参数 θ １ θ ２

88 89 90 91 92 93 94 95 96 97 98