Page 93 - 《华中农业大学学报(社会科学版)》2021年第5期
P. 93

第 5 期          吴   培 等: 基于 C ( n ) GMIDAS模型的中国鸡蛋价格混频预测预警研究                             8 7

               趋势影响、 消除不同变量具有不同量纲不同统计口径的差异化影响, 本研究将所有变量转化为波动率
                               、
               进行分析, 即若 P t P t-1    分 别 表 示 第t 、 t-1 期 的 鸡 蛋 价 格, 则 鸡 蛋 价 格 波 动 率 可 表 示 为R t =ln
                   )
               ( P t -ln ( P t-1 ).
                   3. 建模的关键环节
                   ( 1 ) 变量选择.本研究梳理了 18 个影响国内鸡蛋价格变动的因素( 日、 周、 月、 年度混合数据).
               18 个变量如果全部纳入模型, 可能会存在次要影响因素预测效果较差进而影响全局的情况, 因此如
               何从众多影响因素中选择主要的影响因素进行建模预测至关重要.根据研究目的, 变量选择一般可
               以分为两类, 一是基于预测, 主要从时间先后变化方面考虑, 常用方法有时差相关分析、 K-L 信息量
               分析和峰谷对应分析等, 如刘汉等将 21 个月度景气指标分为先行指标、 一致指标和滞后指标 3 组, 并
               基于此分别构建 3 个模型预测季度 GDP , 结果显示, 先行指标组模型预测效果总体上好于其他两
               组  [ 25 ] ; 二是基于影响程度, 主要考虑自变量对因变量的贡献率, 常用方法有逐步回归、 Lasso 回归、 遗
               传算法、 VIP ( 变量投影重要性) 技术等           [ 26 ] .实际研究中, 亦有学者综合多种变量选择方法进行变量筛
               选, 从而更好地实现稀疏变量的主要信息提取, 如刘小瑜等结合 Lasso 和 VIP 方法从 21 个变量中筛
               选出 6 个重要因素, 构建出口商品价格总指数预测模型具有良好的预测效果                                  [ 26 ] ; 袁铭通过连续小波
               变换后利用 FCM 算法进行变量选择               [ 27 ] .本文以预测为研究目的, 拟先运用时差相关分析筛选出具
               有较好预测意义的先行指标, 同时考虑到不同指标对鸡蛋价格波动的影响不同, 相关度、 贡献率较小
               的先行指标并不会给预测带来明显改善, 将进一步运用 VIP 技术探讨各自变量对因变量的贡献度,
               尽可能地提取主要影响因素.
                   时差相关分析是利用相关系数验证解释变量和被解释变量之间先行、 一致、 滞后关系的常用方
               法.确定最大延迟数后计算所有不同延迟数的时差相关系数, 绝对值最大的时差相关系数对应的延
               迟数就是超前或滞后期, 认为此时解释变量和被解释变量之间的波动最接近.时差相关系数r 的表

               达式如下:
                               n l        -       -
                                  ( x t + l -x )( y t -y )
                            ∑ t = t′                                                     1l  ≥0
                                                           l= 0 , ±1 , ±2 ,, ±L , t′= {           }  ( 2 )
                   r=
                            n l       -      n l      - 2                              1- l l <0
                                                 y t -y
                               ( x t + l -x ) 2  (     )
                         ∑ t = t′         ∑ t = t′
                           y                                                                  是变量个数.
                   式( 2 ) 中: 为解释变量, x 为被解释变量, l 表示先导或滞后期, L 是最大延迟数, n l
                   VIP 技术是基于偏最小二乘回归的一种变量选择方法, 通过相关自变量综合的主成分描述自变
               量对因变量的解释能力, 并根据解释能力的大小筛选变量. VIP 表达式为:
                                                               m
                                                      k
                                                                  2
                                                                    y
                                                                          )
                                        VIP =     m           ∑  r ( , C h W h j 2                    ( 3 )
                                                              h=1
                                                      2      )
                                                       y
                                                 ∑  r ( , C h
                                                 h=1
                                                                         y     ) 为因变量和主成分的相关系
                   式( 3 ) 中: k 为自变量个数, C h    为相关自变量提取的主成分, r ( , C h
                      为自变量在主成分上的权重.
               数, W h j
                                                          传递, 故其 VIP 值可以反映自变量对模型拟合的重
                   自变量对因变量的解释作用通过主成分 C h
               要程度, 通常认为VIP 值小于 0.8 的自变量对因变量的贡献较小, 可以考虑剔除                              [ 28 ] .
                   ( 2 ) 权重函数选择. C ( n ) GMIDAS 模型回归估计的第二个关键问题是确定权重函数( 主要有 BeG
               ta权重函数、 BetaGNonGZero 权重函数、 Almon权重函数、 指数 Almon 权重函数、 ste p 权重函数和无
               约束权重函数 6 种形式) 和预测方法( 主要是 Fixedwindow 、 Rollin g window 和 Recursive 等方法).
               诸多学者建模前均对上述 6 种权重函数及 3 种预测方法进行了比较分析, 各权重函数在多项式构建、
               波动分析、 估计预测方面没有显著性差别                  [ 29 ] , 其中 Beta 、 Almon 、 指数 Almon 权重运用最为广泛, 预
               测效果普遍较好        [ 30 ] ; 3 种预测方法的原理都是比较计算预测值和实际值的误差, 其中, Fixedwindow
               是在样本内取固定长度区间进行估计, Rollin g window 是设定一个长度进行滚动回归, Recursive是
               在初始样本时窗长度基础上, 每向前预测一期就对时窗长度进行扩展, 预测效果差别不大                                        [ 31 ] .本文
                                                             、 无限制)、 两参数指数 Almon 权重函数( θ 1 ≤
               将综合探讨两参数 Beta ( Gamma 分布函数参数 θ 1 θ 2
   88   89   90   91   92   93   94   95   96   97   98