第一节 研究方法

一、数理统计分析法

(1)基尼系数。基尼系数是用于刻画收入分配差异程度的指数,介于0~1之间,值越接近于0,表明收入分配越平均,区域差异越小;值越接近于1,表明收入分配越不平均,区域差异越大。通过对样本单元排序,使y1y2y3…≤yn,根据协方差可以将基尼系数表示为(敖荣军,2007;余海清等,2010;孟德友陆玉麒,2011):

式(1-1)中,G为基尼系数;n是区域数量;yi是区域i农民人均纯收入或城镇居民人均可支配收入;μy是各县域单元农民人均纯收入或城镇居民人均可支配收入的平均;i为农民人均纯收入或城镇居民人均可支配收入从小到大排序的序号。

(2)沃尔夫森指数。沃尔夫森指数则是一个衡量区域总体经济极化程度的指数,公式为(王洋修春亮,2011):

式(1-2)中,W为沃尔夫森指数,其值越大,表示区域极化程度越强;U为修正了的县域单元农民人均纯收入或城镇居民人均可支配收入,U=县域单元平均农民人均纯收入(城镇居民人均可支配收入)×(1-基尼系数);U1为农民人均纯收入(城镇居民人均可支配收入)最少的一半县域的平均值;M为农民人均纯收入(城镇居民人均可支配收入)的中位数。

二、空间统计分析法

本书分别采用Moran's I指数和Getis-Ord G指数来衡量长三角县域单元的全局空间关联和局部关联,借此说明该地区农民人均纯收入或城镇居民人均可支配收入的总体相似程度和局部集聚程度。

Moran's I指数的表达式为(Moran,1950;谢花林,2010;叶长盛朱传民,2011;文玉钊等,2012;朱传民等,2012)

式(1-3)中,I为Moran's I指数,范围在[-1,1]之间,当I大于0时,表示空间正相关,当I小于0时,表示空间负相关;XiXj分别表示第i和第j空间单元的观测值;Wij表示空间权重矩阵,空间相邻为1,空间不相邻为0;S0是空间权重矩阵所有元素之和;为区域单元平均值。

Getis-Ord G指数的计算公式为(马晓冬等,2008;靳诚陆玉麒,2009;郭华蔡建明,2010):

式(1-4)中,d为距离,Wd)为以距离规则定义的权重,当区域ij的距离小于d时,Wd)为1,否则为0;XiXj为区域ij的观测值。

三、数据来源及处理

本书数据来源有三类,即各类文献资料、政府网站、各类统计年鉴,具体有中国经济与社会发展统计数据库、《上海市统计年鉴(1990—2012)》《上海经济社会统计(1949—2000)》《浙江统计年鉴(1990—2012)》《江苏四十年》《江苏五十年》等。

需要说明的是,由于统计口径的差异,许多数据要进行处理后才能保证研究的一致性和可靠性。因此,本书对绝大多数数据进行了筛选和验证,尽量选取可靠性和可比性较好的数据。