- 基本公共服务均等化:知识图谱与研究热点述评(国家治理研究书系)
- 姜晓萍 田昭等
- 14395字
- 2020-08-29 20:01:26
第二章 基本公共服务均等化研究方法现状与述评
谢星全(91)
根据研究主题,笔者在中国学术期刊网络出版总库围绕篇名“基本公共服务”检索出中文社会科学引文索引( CSSCI)来源(含扩展版) 、核心期刊收录学术论文7 5 8篇,择取主题为“均等化”议题论文5 0 5篇,筛选出实证研究取向的论文后,重点对公共服务均等化方法论进行了述评,并对国内学界采用的主要定量研究方法进行述评,如普通最小二乘法( OLS)估计、面板模型、综合评价、指数法、因子聚类分析、方差分析等,并对其数理逻辑进行了简单介绍,以期“抛砖引玉” ,推动基本公共服务研究的规范化和科学化。
一、我国基本公共服务均等化研究方法总体简介
1 .重视工具理性,忽视价值导向
传统公共经济学派追求工具理性,从财力转移机制、政府行为偏好、经济产业结构、地区资源禀赋等角度定量研究我国基本公共服务配置效率、供给范围及均等化水平,忽视基本公共服务也是保障人权、增加社会福利、促进公平正义等政治哲学议题。基本公共服务不仅要依赖“谁来供给”“为谁供给” “供给什么”等工具理性,解决供给主体、范围和供给机制等规模效率问题,更应理性思考“为谁供给”的问题,重视基本公共服务的公平、普惠、可及和需求性等价值问题,才能改革传统单向投入型公共服务供给模式,构建“双向互动—需求侧调节”的新公共服务供给体制。这是提升基本公共服务质量的重要途径。
2 .客观评价多,主观评价少
基本公共服务是面向公众提供的产品和服务,公众应是参与基本公共服务生产、分配、消费及评价环节的最重要主体。调查公众需求表达和满意度水平的主观评价是实现基本公共服务“共创共享”的民主途径。分析国内学界评价公共服务的数据来源,可以发现:它们多为年鉴、政府公报、公开文件、政策文本等客观资料,采集公众主观数据的研究较少。虽然有专家赋权的综合评价可在一定程度上减少评价偏误,但是专家意见不等于公众意见,难以对不同民族、阶层、职业群体、年龄、城乡居民等不同主体的利益进行客观评判和利益协调。
3 .数据来源差异大,质量参差不齐
基本公共服务数据按来源途径可分为官方数据和调查数据。前者包括各级政府统计年鉴、公报、政策文件及外国政府或国际组织发布的信息资料(如联合国计划开发署发布的人类发展指数等) 。后者则包括抽样调查数据、定性数据(访谈资料、文本信息等) 、实验数据。目前,官方数据的有效性存在较多争议,特别是许多研究者在研究设计中没有说明数据缺失情况、处理方法,据此得出的评价结论的信度和效度值得怀疑。即便官方数据可以覆盖不同年份、不同地区、不同行业等数据,但数据全不等于数据质量高。数据的质量取决于其有效性与可靠性,其中数据信息的变异性是衡量数据有效性的重要指标。目前,官方数据多是均值数据,数据平均后导致数据信息变异性差,目标群体的组间差异和组内差距发生偏倚,基本公共服务均等化水平可能被高估或低估。而随着抽样调查、定性研究技术的发展和完善,研究者通过严格抽样程序和科学调查方法,可以极大提高数据质量。
4 .定量研究较多,定性研究少
分析国内评估基本公共服务均等化等议题的文献数量,可以发现公共服务评价和城乡公共服务均等化议题的实证研究较多,规范分析较少。特别是实证途径的定量研究大行其道,定性研究凤毛麟角。基于数理统计基础的计量模型常面临经验数据与理论描述不一致的情形。现实环境的计量模型难以避免变量“内生性”“联立性”“遗漏性”“函数形式设定错误”等弊端,据此统计的变量系数容易有偏和不一致,因此定量研究公共服务问题的结论存在较多争议。即便运用专家赋权的多维综合评价方法,但由于赋予变量权重的主观性较大、标准不一、权重各异,得出的公共服务政策建议难免陷入“众说纷纭”的尴尬境地。其实,基本公共服务评估和公共服务均等化首先是提供者与受众的心理感知与评价,考察行政人员与公众的公共服务动机、个体心理与环境的互动机制为定性研究中的访谈、田野调查、焦点小组、个案研究等方法和实验研究提供了新视野,有待学界共同努力,推动公共服务研究的规范化、科学化及范式转变。
5 .评估技术不科学
研究基本公共服务的城乡差异只有采取“同中求异”的比较研究才能避免选择偏差和类比推理的谬误。例如研究者要论证造成基本公共服务城乡差异的制度诱因是“城乡二元户籍” ,科学的研究设计应该是把同一类基本公共服务置于相同地理环境、经济社会水平、人文氛围及相似人口属性特征的多维框架下考察,如果不把这些因素作为控制变量,研究者就不能准确分析均等化的真实水平及户籍制度的独立效应。如果研究基本公共服务均等化问题思路不正确,就如用错误的研究途径分析了正确的研究议题,研究结论的信度与效度就值得商榷。
二、我国基本公共服务均等化研究方法述评
(一)泰尔指数法研究述评
泰尔指数“是一个常用的测度个人或地区间收入差距,抑或不均等程度的分析方法”(92)。在公共服务均等化议题中,是反映总熵指数在不同地区或城乡之间服务差距权重为1的特例。泰尔指数的一般计算公式为
式中,n是样本数,可以是评价对象的地区如省份、市、县等;y i代表基本公共服务均等化水平从低到高第i个省的数值。泰尔指数的取值范围为0~1,值为0表示完全均等,而取值为1表示完全不均等。“泰尔指数的最大特点是可以衡量组内差距和组间差距对总差距的贡献”(93),而且泰尔指数比变异系数更敏感地反映均等化过程,可以更好地评价地区间的差距。但是一般泰尔指数不能消除人口规模的影响,使用人口加权系数可以在一定程度上纠正泰尔指数的偏差。
曾国平等学者采用泰尔指数法,基于政府年鉴和公报数据,量化分析了我国省级基本公共服务的地区差异和时间趋势。(95)龚峰利用中国省级义务教育和医疗卫生服务数据计算泰尔指数,评估公共服务供给均等化的区域差距。田发采用泰尔指数法评估财政体制运行对区域基本公共服务均等化的影响效应。蔡晓珊运用泰尔指数法分析了广东各地公共服务均等化水平。李林君用泰尔指数测算户籍人口和常住人口两种口径下公共服务不均等程度。范柏乃采用浙江省1 1个地市2 0 0 5—2 0 1 2年统计数据,运用泰尔指数法评估了浙江省基本公共服务均等化水平。
(二)变异系数研究述评
变异系数是采用统计学中标准差和均值比来表示的,其公式为
式中,V为变异系数,X i为地区某属性值(例如:人均教育经费支出) ,n为地区个数。V反映了各地区某属性值相对于该指标平均值的整体离散状况,V越大表明某属性值的区域间差异越大。
加权变异系数考虑了人口规模的影响,其公式为
式中,P i为第i个地区人口数,P为全市人口数,其他同上式,P i/P为i地区占全市人口数的比重,用以反映该地区人口规模的影响。Vn越大表明某属性值区域间差异越大。
学者王悦荣运用变异系数分别研究了广东、四川、重庆、深圳、江苏、新疆的基本公共服务均等化水平。(97)张序、李连芬、王郁分别研究了民族地区、西部教育、环境保护公共服务均等化水平。
变异系数虽然可以消除指标不同量纲的差异,为不同类别基本公共服务横向比较创造了优势,但是它的计算过程却不能敏感地反映不同组间公共服务均等化水平。
(三)威廉森系数法研究述评
威廉森系数是由美国学者威廉森提出的,其计算公式为
式中,W为威廉森系数,y与P分别为区域的某属性值和人口数,y i及P i分别为该区域内第i个地区的该属性值及人口数。W值愈大,说明区域内该属性值区域差异愈大。该指数虽然增加了地区属性和人口规模的权数,指数有效性较标准化数据高。但是国内单独采用此研究方法的较少,只是零星出现在综合评价的文献中。
(四)标准数据法研究述评
指标不仅存在指标间量纲差异,而且存在正指标和逆(负)指标的差别,可以在面板数据基础上,对原始数据标准化,消除指标间不同量纲和正负指标差异对因子分析结果产生的影响。标准化方法如下:
zxi=( xi-minxi) / ( maxxi-minxi)
所有逆(负)指标标准化公式为
zxi=( maxxi-xi) / ( maxxi-minxi)
式中,z x i为标准化后的第i个指标数据,正、负指标依次类推,新数据代替原始数据组成新的标准化指标数据。
单独采用标准化指标评估基本公共服务均等化水平的研究较少,研究者通常把数据标准化消除量纲差异,再作为综合评价和计量分析的技术手段。如唐天伟用标准化指数对2 0 0 3—2 0 1 2年我国省级基本公共服务财政支出排序与分类,评价了我国省级基本公共服务的时间趋势和空间差异。
(五)基尼系数法研究述评
式中,G是基尼系数;N为样本量;-Y为样本均值;Y 1,Y 2,Y 3,…,Y n为从大到小的样本值。
李洺运用基尼系数作为公共服务均等化服务标准,分析了我国改革开放后居民绝对收入及生活质量的差异。崔惠玉等通过测算辽宁1 9 8 7—2 0 0 7年的教育基尼系数,分析了辽宁公共教育均等化水平。(99)武力超构建基尼系数,估测各省份的公共服务均等化水平。魏福成综合了7大类基本公共服务评价指标,对2 0 0 5—2 0 1 2年省际的基本公共服务均等化状况进行了考察。
运用基尼系数去测度公共服务均等化程度是不尽合理的,原因有二。一是,基尼系数的原始数据一般不是目标对象的所有数据,而是来源于抽样调查,抽样方法及样本量的不同直接影响基尼系数评估公共服务均等化水平的准确性。二是,基尼系数实际上反映了某类基本公共服务总体时点的差异水平,却不能有效测度不同层次基本公共服务在连续时间轴的发展趋势。
三、综合评价研究方法述评
在公共服务均等化领域,综合评价是常用研究方法,主要用于考察指标值变异的程度。综合评价是整合定量与定性分析思路的研究方法,既可以缩小客观数据与主观情境的差距,也在一定程度上减少了主观评价的随意性。综合评价主要有层次分析法、熵值法及模糊综合评价法等。
层次分析法受主观评价影响最大,熵值法受主观随意性干扰最小,模糊综合评价居于其中。下面,笔者对上述研究方法及应用现状做简单介绍。
(一)层次分析法研究述评
层次分析法( analy tichierarchyprocess,AHP)主要适用于决策结构复杂、决策准则多、指标确权性较大的综合评价问题,是典型的复杂问题简单化的操作方法。层次分析法是主观赋权法的一种,其主观因素就表现在对各指标权重的选择上,实证中往往采用问卷调查的形式来确定每一级指标的权重。基本公共服务是多类别、多层次的政策议题,运用层次分析法对基本公共服务进行分层研究,不仅思路清晰,确权容易,且通过判断矩阵及一致性检验能够确立指标权重的信度及合理性。
1 .层次分析法简介
笔者以层次分析法为例,对研究基本公共服务均等化的层次分析方法的一般过程做简介。
( 1)建立基本公共服务层次结构。研究者首先要确定基本公共服务均等化评价层次及其指标体系。例如研究者可以建立四类三级层次的基本公共服务评价体系,如图2—1所示。
( 2)建立权重评价矩阵。层次分析权重结构见表2—1。
经过公共服务专家、政府官员、公众等多主体反复磋商,最后得出评价指标权重系数如表2—2所示。
专家对同一层次指标进行两两比较,给出它们相对重要的判断值,全部指标经过两两判定之后,就可以形成一个比较判断矩阵。这里为不失一般化,笔者采用b m*n矩阵进行示例:
式中,B i为当前层目标评价因素,b i j是B i相对于Bj的重要度,例如以表2—2中基本公共服务A和基本公共服务B为例,bAB表示基本公共服务A相对于基本公共服务B的重要度。
( 3)计算单准则条件下指标的权重系数。运用特征根法( eigenvaluemethod,EM)计算该权重系数,并将其归一化为同一层次中相应指标对上一层某个指标的权重向量。计算判断矩阵B每一行元素的几何平均值( n是矩阵阶数) :
做归一化处理:
式中,Wi为所求指标的权重系数值,最后的权重向量W=( W1,W2,…,Wn)T。
( 4)进行一致性检验。为了保证所得权重的合理性及正确性,在计算权重向量后,应对每个判断矩阵都进行一致性检验,无法通过一致性检验的矩阵,反馈给打分者,由其对指标分值进行适当修改。求判断矩阵的最大特征根λmax:
计算一致性评价指标,将CI作为度量判断矩阵偏离一致性的指标:
计算一致性比率CR,为了得到不同阶数的矩阵均适用的一致性检验的临界值,还需引入平均随机一致性指标RI,n-2阶数的判断矩阵所对应的RI值见表2—3。
通过公式CR=CI /RI,求得随机一致性比率CR。当“ CR≤0﹒1时,一般认为该判断矩阵具有满意的一致性;当CR>0﹒1时,则认为该判断矩阵不具有一致性,应该调整判断值,直到通过一致性检验为止”(100)。
( 5)计算组合权重。评价指标的组合权重是每层指标系数占总目标的权重系数,例如基本公共服务A~D的各项指标系数占基本公共服务总体系数的权重,其数值是上一层评价指标与下一层评价指标权重系数的乘积。
( 6)对基本公共服务进行分类评价。按照层次分析法得出的各项基本公共服务的权重系数乘以其各层指标的数值,就可得出各项基本公共服务指数,然后建立相应的衡量标准,如“区位熵”等,用以评估各项基本公共服务的时空差异。
2 .公共服务均等化层次研究方法述评
采用层次分析法的学者,如王新民评估了我国省级公共服务均等化水平;刘亮测度了我国体育公共服务的均等化水平;林闽钢等评价了江苏公共服务均等化水平;皮灿研究了广州马赛克式村落公共服务设施均等化水平。
国内学界运用层次分析法研究基本公共服务均等化议题,指标赋权存在主观随意性较强的缺点。基本公共服务不仅是客观指标的量化,也是典型的主观概念。一是,其蕴含丰富的政治哲学意蕴,公共价值本身是难以量化的多维概念,不能简单被统计数据代表;二是,层次分析法的判断矩阵的指标赋权深受评分者知识、经验及态度的影响,难以避免权重随意性大的缺陷。
(二)熵值法研究述评
在信息论中,熵是系统无序程度的度量。熵值法可以尽可能地保留数据原始信息,减少确定权重的主观性以及多指标变量间信息的重叠。通过计算评价指标信息的离散程度确定各项指标的权重,评价对象的指标值离散程度越高,信息熵越小,说明该指标包含信息越多,其权重也越大;反之该指标的权重越小。当评价对象各项指标离散程度为0时,熵值取最大值,表示该指标不能提供有效信息,应该从评价项目中剔除。
设有m个基本公共服务方案,n项评价指标,形成原始指标数据矩
阵X=( xij)m*n,其中xij≥0,0≤i≤m,0≤j≤n。对于某项指标,不同方案的指标值xij差距越大,则该指标在综合评价中所起的作用越大,其权重也越大。具体公式如下:
( 1)标准化数据。
为了减少评价对象量纲和数量级的差异,需要对原始指标进行标准化处理。主要有统计标准法和极值标准法,这里主要介绍极值标准法,通常需要对正负指标做不同处理。计算第i个地区的第j个评价指标的比重y i j。
正指标:
负指标:
( 2)计算第j个指标的熵值。
式中,k>0,ln为自然对数,ei≥0。如果x i j对于给定的j全部相等,那
么。若设k=1 / lnm,于是有0≤e i≤1。计算第
j个指标的差异性系数
gi=1 - ei
式中,0≤g i≤1。差异系数表示某项指标的离散程度,反映了该指标信息有效性大小,它取决于该指标的熵值ei与1之间的差值,决定指标权重的大小。例如,对于第i项指标,离散程度越大,熵值就越小,有效信息就越高,权重系数也就越大,综合评价就越受该指标的影响。
( 3)计算权重。
( 4)计算综合得分。
式中,Sm是第m项公共服务方案的综合得分。
由于熵值法可以最大限度减少主观随意性,尽可能地反映数据原始信息,通常与其他技术结合使用,已成为综合评价最多的研究方法。单独运用熵值法研究公共服务均等化议题较少。沙智慧运用熵值法评价四川城乡基本公共服务均等化水平;王肖惠量化分析了陕西农村公共服务的空间差异;徐翠枚评估海南省公共服务均等化水平;冯骁研究了我国城市公共服务的空间差异与影响趋势。
四、基本计量模型研究方法述评
(一)运用面板数据研究基本公共服务均等化述评
如果研究者要探索基本公共服务在不同时点的影响因素、形成机制、作用大小或随时空变化的动态趋势,面板数据方法是理想的研究方法。正如我们指出的那样,基本公共服务是一个随时间变迁和跨区域的公共产品和服务,它既有随时间不随地点而变化的可观测特质,也有随地点而不随时间变化的属性,还有随时间又随地点而变化的动态特性。采用大样本容量,把不同时点从同一总体中抽取的多个随机样本混合起来使用,可以获得更精密的估计量和更具功效的检验统计量。笔者认为,实现对我国城乡基本公共服务均等化的动态监测,面板方法是有效途径。
面板数据是研究者在不同时间尽可能地跟踪同一个人、同一个家庭的公共教育支出、劳动就业小时数、基本卫生医疗设施等信息资料集合。在以后若干时点上,对同样的人群反复采访,以便得到同一群人在不同年份的基本公共服务信息资料。我国学界多采用年度省级面板数据,数据均来自官方的年鉴、公报等政策文件,指标的客观性较强。使用主观调查的动态面板数据(如中国家庭金融调查、中国家庭动态调查等)研究基本公共议题的较少。
1 .面板数据的一般模型
对于随机抽取的横截面观测值i来说,基本的不可观测效应模型( UEM)可以写为
yit=xitβ+ci+μit( t=1,2,…,T)
式中,xit表示一个1*K向量,它能够包含随t而不随i变化的可观测变量、随i而不随t变化的可观测变量,还有随i又随t变化的可观测变量。对于ci来说,在应用中也称为“不可观测效应”“特征变量”及“不可观测异质性” 。在公共服务议题研究中,它可表示为个体感知水平、家庭隐性收入、公共服务质量等横截面数据,μit表示特质误差或特质扰动项,它表示不可观测的变量,这些变量既随时间t而变化也随i变化,例如它可以代表不同个体的公共服务满意度、公共财政支出、政府支出偏好去影响因变量yit。在面板数据模型传统处理方法中,当把ci看成一个随机变量时,即当研究者从理论上认为或逻辑判断ci与可观测解释变量xit和不可观测特质误差项μit都不相关时,该模型被称为“随机效应”模型。相反,当ci看成一个随机变量时,即当研究者从理论上认为或逻辑判断ci与可观测解释变量xit存在任意相关性时,此时ci称为“个体固定效应” 。针对ci的不同性质,研究者通常会分别采取随机效应估计和固定效应估计β系数。
2 .面板模型的假设与估计
在高级计量经济学中,研究者一般不假设x i t是非随机的,而是限制y i t的期望值如何依赖于其他时期的解释变量,即对于s≠t,一旦控制xit 和ci时,xis对yit没有偏效应,这样的假设与没有以不可观测效应为条件的严格外生性假设相比,却更符合现实情况。
对于面板不可观测效应模型,传统上有两类估计方法:
( 1)当对于固定时间T而言,横截面样本N充分大时,采用混合O L S估计模型参数是渐进有效的;
( 2)当μit在控制xi和ci条件下的期望为0,且它的方差具有随时间t变
化的常数值时,当N→∞,的估计系数是渐进一致的;当且μi t是序列相关时,利用稳健方差矩阵可获得沃尔德统计量去构造有效的统计推断,此时可采用一般F G L S分析,特别是对于非常大的N来说,该方法估计是不错的选择。更多情况是,研究者利用面板数据考虑ci与x it是任意相关时,固定效应估计方法是不错的选择。当μi t在控制x i和c i条件下的期望为0时,此时固定效应要满足两个假设条件:当xit的每一个元素对于某些横截面单位来说是不随时间而变化时,是以X为条件的无偏估计量;当μit的方差是不随时间t变化的常数时且不存在序列相关时,N→∞,估计量是渐进有效的,此时普通最小二乘法和差分法是合适的估计方法。
3 .国内面板数据研究述评
王磊通过建构柯布—道格拉斯生产函数模型,利用1 9 9 7—2 0 0 4年青海省的时间序列数据和我国1 3个省市2 0 0 3年的面板数据建立计量模型,实证了我国各项财政支付政策对公共服务均等化的影响。(104)安体富采用中国3 1个省份2 0 0 2—2 0 0 6年共5年的面板数据,实证分析了财政能力、转移支付与公共服务水平的内在联系。贾俊雪运用空间面板数据模型考察了改革开放以来我国政府间财政收支责任安排对地方公共服务发展和均等化的影响。刘成奎基于2 0 0 4—2 0 1 1年我国2 6个省份的面板数据,实证分析了财政分权、地方政府城市偏好与基本公共服务均等化的关系。赵楠通过1 9 9 8—2 0 0 8年的面板数据实证检验中央财政转移支付在民族地区公共服务均等化中的效应。和立道基于2 0 0 0—2 0 0 8年的面板数据的估计,实证分析财政支出、居民收入水平、城镇化与城乡基本公共服务供给的内在联系。胡洪曙采用空间面板模型,分析2 0 0 5—2 0 1 2年各省政府基本公共服务财政投入和产出水平的空间相关关系,研究了转移支付对公共服务供给的空间作用机制。甘家武采用面板似不相关回归估计方程(SUR)进行估计,考察了2 0 0 0—2 0 1 1年云、贵、川和黔四省区之间的基本公共服务均等化、商品市场分割的变化趋势。刘成奎采用2 0 0 4—2 0 1 0年中国2 8个省份面板数据的联立方程组,定量分析了政府城市偏好、网络信息与城乡基本公共服务均等化的一般联系。赵建国采用我国2 0 0 4—2 0 1 3年年鉴和政府公报数据,构建面板模型,实证研究中央财政转移支付制度对东、中、西部地区基本公共服务供给均等化的影响。
目前,学界应用面板研究基本公共服务均等化的棘手问题之一是不能假定不同时点的观测数据是独立分布的,如果假设不满足,估计参数会产生严重偏误。需要研究者敏锐识别模型错误并采取补救技术,修正相关模型后,谨慎地得出结论。
虽然国内学者常用差分法消除那些不随时间变化的无法观测的变量,例如基本公共服务属性,普惠性、公平性等变量,但是现实情况是面板模型的回归元如地方政府财政收入与上一期的公共财政支出有显著相关性,此时固定效应估计量的效度将会显著下降。
另一个常被国内学界忽略的问题是,面板模型的数据存在测量误差时,差分估计会失效。例如我国统计年鉴数据的真实性和有效性一直备受争议,如果数据存在测量偏差,差分面板模型将会导致比混合OLS估计更糟糕的结果,研究结论几乎无效度可言,需要研究者小心地求证,谨慎地得出结论。
(二)OLS估计法研究基本公共服务均等化述评
使用回归分析是探索公共服务均等化解释性问题的基本途径,可以对公共服务均等化的影响因素、形成机制、演变趋势及功能价值做出评价、解释、预测,并据此提出相关对策建议。笔者首先简单回顾OLS估计一般方法,然后再对回归模型的前提假设及应用问题进行阐释。
1 .OLS多元回归分析的一般模型简介
多元回归分析允许我们分析多个可观测因素(解释变量或自变量)x影响被解释变量(因变量)y。一般的多元回归模型总体可以写成
y=β0+β1 x 1+β2 x 2+β3 x 3+…+βk x k+μ
β0为方程截距,β1,β2,…,βk分别是与x1,x 2,…,x k相联系的参数,我们把这类不同于截距的参数βk称为斜率参数,它表示在控制其他变量因素条件下,x k每变化一个单位,y平均变化βk个单位。但是对于OLS估计量要达到无偏性和有效性,却需要满足以下几个前提条件:
( 1)OLS估计的总体模型需要是β0,β1,…,βk的线性函数,但是y和自变量xk都可以是我们所关注变量的任意函数,因为这样才能保证参数对y的合理有效的解释。
( 2)变量是包含n次观测的随机样本,{ ( xi1,xi2,…,xik,yi) ,i=1,2,…,n}它来自假设1的总体模型。
( 3)在样本中(因而在总体中) ,没有一个自变量是常数,自变量之间也不存在严格的共线关系,即该假设允许自变量之间存在相关关系,但不能高度相关。
( 4)给定自变量的任何值,误差μ的期望值为0,此假设表明总体模型没有遗漏与自变量相关的重要因素,且模型的函数形式设定正确(如没有不正确的设定自变量的高次项和交互项等) 。
统计研究表明,在假设( 1)~( 4)下,回归估计量是总体参数βj的无偏估计量,即。
( 5)总体模型中给定任意解释变量,误差μ都具有相同的方差,它表示在误差方差是常数时,OLS估计参数是总体真实参数的一致估计量。
2 .国内OLS估计基本公共服务均等化研究方法述评
皮灿以广州市各区(市)为评价单元,采用皮尔逊相关分析法及通径分析法,分析了广州公共设施的空间差异及基本公共服务的供需状况。王敬尧采用双变量probit模型进行回归分析发现,公共服务产出和公民感受呈现显著的非一致性。宋洁用R型聚类和复相关系数筛选指标,实证研究某省1 9 9 1—2 0 0 9年公共服务均等化水平。胡德仁采用多元线性回归方法,利用2 0 0 4—2 0 0 6年中国各地财政支出数据,分析中国现行财政转移支付政策的主要影响因素和价值取向。杨亦然采用2 0 0 0—2 0 1 0年统计数据,利用O L S回归估计方法,研究了重庆市各区县财政支出对基本公共服务水平的影响程度。侯建明用二元logit模型,分析了长春市、吉林市、延边朝鲜自治州三地流动人口公共服务均等化水平。(106)。
笔者认为,国内OLS估计研究公共服务均等化议题可能存在的缺陷主要有以下几个方面:
( 1)研究者缺少总体模型是线性参数的论据。
OLS回归估计方法的第一个前提是研究者必须理论论证或给出的总体模型是线性的统计证据,否则回归估计模型参数将是有偏的。国内许多研究者在使用OLS估计时,没有给出残差散点图和回归拟合图,也缺少总体模型是参数的线性理论说明。如此,公共服务均等化统计结论的效度是有待商榷的。
( 2)变量多重共线问题。
国内部分学者用OLS估计法研究公共服务均等化议题时,许多解释变量在理论上是显著相关的,如地方政府财政自给能力与中央转移支付在统计上也可能高度相关,如果是非自动识别多重共线软件操作,会导致模型估计参数的严重偏误,如果不寻找有效的代理变量或工具变量,则又可能会造成模型遗漏变量问题,导致估计参数有偏。
( 3)遗漏变量问题。
在OLS估计基本公共服务均等化模型中,由于基本公共服务理论要素的残缺、某些理论概念难以量化及数据的不可得性,模型无法避免应该纳入模型却没有纳入模型的变量遗漏问题,会导致模型参数估计的不一致。例如研究者在模型中想研究地方政府财政收入与公共服务支出的关系,按照一般财政学理论,模型显然遗漏了“经济建设支出”这一解释变量,就会造成模型的内生性问题,造成模型估计参数不一致。
( 4)联立性问题。
在定量研究公共服务均等化模型中,部分变量会互为因果关系。例如地方政府公共服务支出不仅显著影响公共服务均等化水平,公共服务均等化水平也会影响地方政府公共服务支出数额。研究者如果仅考虑公共服务财力投入的单向影响,则有可能造成模型参数估计不一致,统计结论的可靠性较低。
( 5)异方差检验问题。
许多研究者在用OLS估计公共服务均等化模型时,并没有呈现统计模型是否是异方差的稳健检验统计量,如果在异方差条件下,估计参数的方差越大,表明估计量越不精确,也就暗示所给出的置信区间和假设检验越不准确,统计结论的信度也就越低。
(三)因子分析法研究基本公共服务均等化述评
因子分析的基本思想是根据评价对象相关性大小把原始变量分组,使得同组内的变量之间相关性较高,而不同组的变量间的相关性则较低。每组变量代表一个基本结构,并用一个不可观测的综合变量(因子)来表示,这个基本结构就称为公因子。对于研究某一具体问题,原始变量可以分解成两部分之和的形式,一部分是少数几个不可测的所谓公共因子的线性函数,另一部分是与公共因子无关的特殊因子。设有k个观测变量,分别为x 1,x2,…,xk,其中x i是标准化变量。因子模型的一般表达式可以表示为
xi=ai1 F1+ai2 F2+…+aimFm+μi( i=1,2,…, k)
在该模型中:
( 1)F1,F2,…,Fm叫公因子,它们是各个观测变量所共有的因子,解释了变量之间的相关程度。
( 2)μi为特殊因子,它是每个观测变量所特有的因子,相当于多元回归的残差项,表示该变量不能被公因子所解释的部分。
( 3)aim称为因子载荷,它是第i个变量在第m个公因子上的负载,即它们之间的相关系数,它的绝对值数值越大表示变量x i与公因子Fm关系越密切。
( 4)变量xi和xj之间的负载可以理解为通径系数,如果从观测数据计算出的相关系数和从模型推导出的变量间的相关系数差别很小,那么我可以说模型很好地拟合了数据,因子解是最优解。
( 5)公因子方差又叫共同度,指观测变量方差由公因子决定的比例。如变量x i的公因子方差记为hi2。变量的方差由两部分组成,一部分由公因子决定,一部分由特殊因子决定。公因子方差表示了变量方差中能被公因子所解释的部分,公因子方差越大,变量能被因子说明的程度越高,公因子代替观测变量后,保留了每个变量的大部分信息。
( 6)因子贡献。记为Vp,它等于和该因子有关的因子负载的平方和。现实中,用每个因子所解释的方差占所有变量的总方差的比例表示,k个变量的总方差记为Vk,则Vp/ Vk表示第p个因子解释所有变量总方差的比例。
按照经济计量学关于因子分析的一般描述,因子分析主要包括以下四个步骤:
( 1)计算所有变量的相关矩阵。相关矩阵用于判断应用因子分析方法是否合适,一是可以看反映象相关矩阵元素数值大小,二是看巴特利特球体检验系数大小,如果巴特利特球体检验KMO值大于0﹒7,意味着不适合做因子分析的原假设被拒绝,则说明因子分析是合适的。
( 2)提取公因子。这一步研究者可以根据研究目标的不同,选取特征根法或碎石法确定因子数目,但也可以根据理论假设主观确定有意义的因子数目,这样就可以求出因子解。
( 3)进行因子旋转。如果因子分析的目标只是把很多变量浓缩为少数几个因子,因子的确切含义是什么并不重要,应该选用正交旋转;如果研究者是想得到几个理论上有意义的因子,应该选用斜交因子;如果两个因子确定高度相关,研究者一般会选取更少的因子重新进行分析。
( 4)计算因子值。因子值是各个因子在每个样本案例上的得分值,一般可采用主成分分析法或公因子法求解因子值。得出因子值后,研究者根据研究目标,把因子作为变量来使用,进行如回归、分类或综合评价等其他统计分析。
国内采用因子分析法估算基本公共服务均等化的学者,如姜鑫、成小平对我国省际公共服务均等化水平进行了评估;方元子考察了影响地区公共服务成本差异的环境因素;吴强计算了各省级地区基本公共服务成本差异系数,动态测算各地区所需的转移支付数额;睢党臣用因子聚类技术,评估了陕西农村基本公共服务的空间差异和发展趋势;崔敏、牛芳兵、黄小舟通过实证分析了河南镇平县、山东省、武汉市公共服务的区域分布特点。
由于研究者多使用年鉴、公报等客观数据,提取公因子过程主观性较大。根据特征根法提取的公因子可能会丢失有理论价值的指标。相反如果采用探索性因子分析,公因子涵盖的指标可能包括没有理论意义或错误归类的指标。研究者运用因子分析法,应该在统计指标和专业理论之间做出合理取舍,尽可能地发挥因子分析的优点,减少分析盲目性。
(四)运用方差分析法研究基本公共服务均等化述评
在公共服务均等化议题中,研究者如果要研究基本公共服务均等化水平,可以通过定量分析基本公共服务在城镇地区和农村地区之间是否存在显著差异,也就是比较多个研究总体均值问题,方差分析就是有效的方法。在分析随机变量的可控因素时,如果我们只考察基本公共服务满意度、财政支出等是否在不同地区(如东部、中部、西部)显著不同时,我们称之为单因素分析。如果研究者要同时比较公共服务满意度、财政支出在不同地区、户籍、阶层、职业等群体分布中是否存在显著差异,此时可以采用多因素分析。进行方差分析的基本思路是首先通过实验或调查,取得不同变量(一般是类别变量)观测水平条件下被解释变量的样本,然后利用样本构造统计量,检验被解释变量总体均值在不同因素(类别变量)的总体均值是否相等,如果均值相等的假设被检验,则说明因素及水平对被解释变量的影响不显著,反之则显著。从方差分析目的看,要检验被解释变量如基本公共服务的不同满意度水平在不同因素之间(地区、户籍)是否存在显著差异,而实现这个目的的手段是进行方差比较。我们知道被解释变量的观察值差异一方面可能是由因素(不妨称之为自变量)水平本身造成的,例如公共服务不同满意度可能是不同户籍居民评价存在显著差异,我们称之为系统性差异;另一方面由于抽选样本的随机性而产生的差异,例如农村居民对基本公共服务满意度也显著不同。这两个方面产生的差异可以用两个方差来分析,一个是水平之间的方差(组间差异) ,另一个是水平内部的方差(组内差异) ,前者既包括系统性差异,也包括随机性差异,而后者仅包括随机性差异。如果因素的不同水平不影响被解释变量的不同观察水平,那么在水平之间的方差就仅有随机性差异,而没有系统性差异,则此时它与水平内部的方差就应该近似,两个不同水平的方差比值接近于1。反之,不同的水平对结果产生影响,在水平之间的方差中就不仅包括随机性差异,也包括系统性差异,这时,水平之间的方差就会大于水平之内的方差,两个方差的比值就远高于1,当这个比值达到统计临界值,我们就可以做出判断,即因素的不同水平之间存在显著差异。
水平间方差和水平内方差之比通常服从F分布。本文基于现实广泛应用的多因素方差进行解释,以无交互作用的双因素方差分析为例。
假设所有的Xij都互相独立且服从相同方差的正态分布,即有Xij~N(μij,σ2) 。因此,如果两个因素对实验的结果影响都不显著,那么显然所有的观察值有X i j都来自同一分布总体,有Xij~N(μij,σ2) 。记总体均值的总平均值为
a i=μi-μ,称a i为水平Ai的效应;b i=μi-μ,称b i为水平Bi的效应,显然有:
在上述假设下,可以得到以下数学模型:
Xij=μ+ai+bj+εij, εij~N( 0, δ2)
上式表明,X i j一方面受A、B两因素的影响,另一方面也受许多随机因素的影响。如果a i的影响不显著,则所有的效应值a 1,a 2,…,a k的值都为0,否则必有一些效应值不为0;如果水平B i对总体的影响不显著,则所有效应值b1,b2,…,bk不为0。因此,如果要检验因素A的作用,可建立假设:H0:a1=a2=…=ak=0;H1:a1,a2,…,ak不全为0。
总离差平方和为
上式中,S S T为总离差平方和,S S A为因素A各水平组的组平均值与总平均值之间的离差平方和,S S B是因素B的离差平方和,S S E是误差平方和,S S E=S S T-S S A-S S B可以证明S S A与S S B是相互独立的。SSE~X2[ ( k - 1) ( r - 1) ] ,在H0成立时,有,从而比值 ,容易得知,当H0不成立时,比值F∧有增大的趋势,因此在显著性水平α下,若F∧>F α[ ( k- 1) ,( k-1) ( r-1) ] ,则拒绝原假设H0。同理,要检验因素B的作用,则可建立假设:H ′0:b 1=b 2=…=b r=0;H ′1:b 1=b 2=…=b r不全为0。
则在H′0成立时,可以证明SSB~X2( r-1) ,于是有F∧= ,因此在显著性水平α下,若F∧>Fα[ ( k- 1) ,( k- 1) ( r- 1) ] ,则拒绝原假设H ′ 0。
笔者采用大规模调查数据,首次把居民不同人口特征置于地区、城乡的三维框架下进行考察,对基本公共服务满意度进行方差分析。实证表明:同一区域相似人口属性的居民对基本公共服务满意度评价存在显著的城乡差异;均为城镇或农村户籍的相似人口属性的居民对基本公共服务评价存在显著的区域差距;同一区域均是城镇或农村户籍的居民对基本公共服务满意度评价存在人口学差异。
(五)数据包络分析研究方法述评
国内部分学者也采用数据包络分析法( DEA)研究公共服务均等化问题,如学者陈昌盛、蔡跃洲评估了各地区公共服务水平间的相对效率。(107)龚锋实证评估了2 0 0 5年中国内地7 0个大中城市公共安全服务的供给效率。
但是,数据包络分析法也存在较多应用短板。一是,它不能评估公共服务在地区或城乡间的绝对效率,从而无法考证我国基本公共服务特别是农村公共服务投入不足的问题。二是,数据包络分析是建立在评价对象的绩效基础之上的,而基本公共服务是一个综合产品和服务,基本公共服务的评价应立足价值而不仅是建基于效率。这类工具理性的评估方法忽视了公共服务的价值尺度及公民满意度,造成量化研究的有效性不高。