Page 83 - 《华中农业大学学报(社会科学版)》2020年第1期
P. 83

华中农业大学学报( 社会科学版)                                   ( 总 145 期)
    7
     8
   中出现了多个性别相同的子代, 本文参考已有研究将其看作是对同一个家庭的多次观测                                         [ 30 ] .最后,
   根据劳动力市场规则剔除子代未成年( 18 周岁以下) 的数据样本, 同时剔除了存在异常值及缺失值的
   样本, 例如, 年收入为负值或受教育年限为负值的样本等. Couch 等认为关于代际流动的研究在选取
   样本时, 将收入为“ 0 ” 的样本剔除的做法不合理                 [ 31 ] , 所以本文保留了父代或子代收入为“ 0 ” 的样本.
   经过上述处理, 本文共获得男性子代的有效配对样本 1766 个, 女性子代的配对样本 730 个.
       2. 变量说明
       被解释变量: 家庭代际流动.数据来自 CHIP 问卷中的问题“ 2013 年这份工作的收入总额( 工资
   性收入或经营净收入等总额)( 元 / 年)”.本文通过对父代的月平均收入和子代的月平均收入所在纳
   税层级进行比较计算并赋值.向上流动, 记为“ 1 ”; 未明显流动, 记为“ 0 ”; 向下流动, 记为“ -1 ”.各类
   别的数值只是代表层次之间的差别, 并不表示绝对性含义.
       主要解释变量: 本文选取“ 父代受教育水平”“ 子代受教育水平”“ 子代求职途径” 以及“ 父代收入”
   作为主要的解释变量.其中, 将子代求职途径归纳为三组, 即“ 通过家人联系”“ 亲戚介绍”“ 朋友或熟
   人介绍” 的方式并设置虚拟变量来探讨社会资本对农村家庭代际流动的影响.
       控制变量: 本文参照以往学者的研究                [ 32 ] 加入其他可能对代际流动产生影响的变量, 具体包括” 父
   代年龄“” 父代婚姻状况“” 父代健康状况”“ 父代民族”“ 是否村干部”“ 是否参加医疗保险”“ 是否参加养
   老保险”“ 子代年龄” 以及“ 区域经济发展水平” 等变量.各变量详见表 1 .
                                       表 1  变量定义及说明
       变量符号            变量名称                                变量定义或赋值
    Y             家庭代际流动             向下流动 =-1 ; 未发生明显流动 =0 ; 向上流动 =1
                  父代受教育水平            父代接受正规教育的年限
    edu 1
                  子代受教育水平            子代接受正规教育的年限
    edu 2
    soc           子代求职途径             根据“ 家人联系”“ 亲戚介绍”“ 朋友或熟人介绍” 设置一组虚拟变量
    income        父代收入               对父代的月收入取对数
                  父代年龄               统一用 2013 年减去出生年份
    a g e 1
                  子代年龄               统一用 2013 年减去出生年份
    a g e 2
    marria g e    父代婚姻状况             根据“ 初婚”“ 再婚”“ 丧偶”“ 离异”“ 同居” 设置一组虚拟变量
    health        父代健康状况             很不健康 =1 , 很健康 =5 , 从 1~5 健康程度递增
    national      父代民族               汉族 =1 , 少数民族 =0
    vca           是否村干部              父亲是村干部 =1 , 不是 =0
    medical       是否参加医疗保险           父亲参加医疗保险 =1 , 没有参加 =0
    endowment     是否参加养老保险           父亲参加养老保险 =1 , 没有参加 =0
    re g ional    区域经济发展水平           对该农村所在城市的人均 GDP 取对数


     3. 模型设定
       本文使用有序多分类 Lo g it模型进行实证分析, 该模型一般运用于研究在测量层次上并不连续
   的变量( 定序变量). Lo g it模型不要求变量满足正态分布或等方差, 它的基本表达式为

                                       1                1
                              p=              =                                           ( 1 )
                                          (
                                  1+e- f x ) 1+ex pα+∑ β i x i )
                                                      (
       经过对数变换可得
                                           P
                                   y=ln       =α+Σx i β i+ε                               ( 2 )
                                         1-P
       结合式( 2 ) 并根据前文的假设, 构建如下模型:
                                                                                          ( 3 )
                      Y j=α+ β 0 edu 1 j+ β 1 edu 2 j+ β 2 soc j+ β 3 income j+ β i z i j+ε j
                                                                、     分别表示第 j 个家庭父代
       其中, Y j 是定序因变量, 代表第 j 个家庭的代际流动情况; edu 1 j edu 2 j
                                                                                表示第 j 个家
   和子代的受教育水平; soc j        表示第 j 个家庭的子代求职途径, 为一组虚拟变量; income j
                                      β i
   庭父亲的收入; z i j   代表了其他控制变量, 表示各个控制变量的系数; ε j                     表示随机误差项.
   78   79   80   81   82   83   84   85   86   87   88