Page 93 - 《华中农业大学学报(社会科学版)》2021年第5期
P. 93
第 5 期 吴 培 等: 基于 C ( n ) GMIDAS模型的中国鸡蛋价格混频预测预警研究 8 7
趋势影响、 消除不同变量具有不同量纲不同统计口径的差异化影响, 本研究将所有变量转化为波动率
、
进行分析, 即若 P t P t-1 分 别 表 示 第t 、 t-1 期 的 鸡 蛋 价 格, 则 鸡 蛋 价 格 波 动 率 可 表 示 为R t =ln
)
( P t -ln ( P t-1 ).
3. 建模的关键环节
( 1 ) 变量选择.本研究梳理了 18 个影响国内鸡蛋价格变动的因素( 日、 周、 月、 年度混合数据).
18 个变量如果全部纳入模型, 可能会存在次要影响因素预测效果较差进而影响全局的情况, 因此如
何从众多影响因素中选择主要的影响因素进行建模预测至关重要.根据研究目的, 变量选择一般可
以分为两类, 一是基于预测, 主要从时间先后变化方面考虑, 常用方法有时差相关分析、 K-L 信息量
分析和峰谷对应分析等, 如刘汉等将 21 个月度景气指标分为先行指标、 一致指标和滞后指标 3 组, 并
基于此分别构建 3 个模型预测季度 GDP , 结果显示, 先行指标组模型预测效果总体上好于其他两
组 [ 25 ] ; 二是基于影响程度, 主要考虑自变量对因变量的贡献率, 常用方法有逐步回归、 Lasso 回归、 遗
传算法、 VIP ( 变量投影重要性) 技术等 [ 26 ] .实际研究中, 亦有学者综合多种变量选择方法进行变量筛
选, 从而更好地实现稀疏变量的主要信息提取, 如刘小瑜等结合 Lasso 和 VIP 方法从 21 个变量中筛
选出 6 个重要因素, 构建出口商品价格总指数预测模型具有良好的预测效果 [ 26 ] ; 袁铭通过连续小波
变换后利用 FCM 算法进行变量选择 [ 27 ] .本文以预测为研究目的, 拟先运用时差相关分析筛选出具
有较好预测意义的先行指标, 同时考虑到不同指标对鸡蛋价格波动的影响不同, 相关度、 贡献率较小
的先行指标并不会给预测带来明显改善, 将进一步运用 VIP 技术探讨各自变量对因变量的贡献度,
尽可能地提取主要影响因素.
时差相关分析是利用相关系数验证解释变量和被解释变量之间先行、 一致、 滞后关系的常用方
法.确定最大延迟数后计算所有不同延迟数的时差相关系数, 绝对值最大的时差相关系数对应的延
迟数就是超前或滞后期, 认为此时解释变量和被解释变量之间的波动最接近.时差相关系数r 的表
达式如下:
n l - -
( x t + l -x )( y t -y )
∑ t = t′ 1l ≥0
l= 0 , ±1 , ±2 ,, ±L , t′= { } ( 2 )
r=
n l - n l - 2 1- l l <0
y t -y
( x t + l -x ) 2 ( )
∑ t = t′ ∑ t = t′
y 是变量个数.
式( 2 ) 中: 为解释变量, x 为被解释变量, l 表示先导或滞后期, L 是最大延迟数, n l
VIP 技术是基于偏最小二乘回归的一种变量选择方法, 通过相关自变量综合的主成分描述自变
量对因变量的解释能力, 并根据解释能力的大小筛选变量. VIP 表达式为:
m
k
2
y
)
VIP = m ∑ r ( , C h W h j 2 ( 3 )
h=1
2 )
y
∑ r ( , C h
h=1
y ) 为因变量和主成分的相关系
式( 3 ) 中: k 为自变量个数, C h 为相关自变量提取的主成分, r ( , C h
为自变量在主成分上的权重.
数, W h j
传递, 故其 VIP 值可以反映自变量对模型拟合的重
自变量对因变量的解释作用通过主成分 C h
要程度, 通常认为VIP 值小于 0.8 的自变量对因变量的贡献较小, 可以考虑剔除 [ 28 ] .
( 2 ) 权重函数选择. C ( n ) GMIDAS 模型回归估计的第二个关键问题是确定权重函数( 主要有 BeG
ta权重函数、 BetaGNonGZero 权重函数、 Almon权重函数、 指数 Almon 权重函数、 ste p 权重函数和无
约束权重函数 6 种形式) 和预测方法( 主要是 Fixedwindow 、 Rollin g window 和 Recursive 等方法).
诸多学者建模前均对上述 6 种权重函数及 3 种预测方法进行了比较分析, 各权重函数在多项式构建、
波动分析、 估计预测方面没有显著性差别 [ 29 ] , 其中 Beta 、 Almon 、 指数 Almon 权重运用最为广泛, 预
测效果普遍较好 [ 30 ] ; 3 种预测方法的原理都是比较计算预测值和实际值的误差, 其中, Fixedwindow
是在样本内取固定长度区间进行估计, Rollin g window 是设定一个长度进行滚动回归, Recursive是
在初始样本时窗长度基础上, 每向前预测一期就对时窗长度进行扩展, 预测效果差别不大 [ 31 ] .本文
、 无限制)、 两参数指数 Almon 权重函数( θ 1 ≤
将综合探讨两参数 Beta ( Gamma 分布函数参数 θ 1 θ 2