摘要:2010年11月9日,笔者发布的《统计数据和主观感受:CPI是风动还是幡动?》一文,引起了各方的广泛关注和争论。其焦点集中在该文第三部分对CPI数据编制情况还原性估计的准确性上面。本文对主要争论意见进行了回顾和评述,对原文的估计方法进行了反思。这场讨论有助于研究者理解CPI编制的原理和具体细节,也将有助于推动CPI指数编制与研究的科学化。
2010年11月9日,笔者撰写了《统计数据和主观感受:CPI是风动还是幡动?》一文,引起了各方的广泛关注,并对其内容进行了激烈的争论。焦点集中在该文第三部分对CPI数据编制情况还原性估计的准确性方面,钱军辉博士[①]、桑得博士[②]等其他多位朋友均对原文估计方法可能产生的问题进行了分析。为了把问题搞清楚,笔者与大部份争论者进行了充分的讨论,在试图理解对方批评思路的前提下,对原文的估计方法进行了反思。与此同时,笔者也对CPI编制的制度设计做了更为详实的了解,深化了在这方面的认识。现通过此文,对近期的争论做述评如下。
一、《幡动》一文分析的简要回顾
在每五年调整一次商品篮子,每年则根据城乡居民12万户消费调查资料及相关资料调整一次权数的情况下,CPI指数的编制与未公布权重的钉住一篮子货币做法非常相似:理论上,两者均按照分类对象进行加权计算,而且权数均为1。因此《幡动》一文,借鉴Frankeland Wei(1994)对货币钉住篮子的权重分析方法,对CPI的价格指数进行估算。当然,经过讨论,笔者发现因为汇率数据与CPI数据在频率、精确性等方面均在一些细节的差异,而这些差异将对分析结果产生不可忽视的影响,这在后文中将进行详细介绍。由于CPI指数权重存在5年一次“商品篮子”的调整问题,所以原文使用了2006年1月至2010年5月的数据进行分析,估计式为:
其中为第i项分类价格指数,各参数的估计值对应于CPI各分项权重。在此基础上原文提出:若编制完全按照8项分类进行加权计算,则常数项应该不能被拒绝为0;而如果常数项估计值显著,且为负值,则表明CPI存在低估的可能(原文表述是“表明CPI为人为低估了”,这样表达确实不够严谨)。
估计结果可以描述如下:(1)所有待估计参数t值均非常显著,拟合优度、DW值等都非常理想;(2)各项分类权重值均与2001年基期的参照系差异不大;(3)还存在两个问题:第一是:截距项为-7.53,第二:各项权重系数之和并不1,而是108。原文仅对截距项的含义进行了解释,并认为其来源系由于“系统性低估”。当然,原文也承认:“由于CPI编制细节尚未公开,因此相关研究(包括原文的研究)充其量也只是水中望月、镜里看花。要对CPI指数有更准确的理解,还有待于相关细节的公开和透明”。
原文迅速引发了各方的关注和讨论,钱军辉博士、桑得博士,以及其他多位朋友均对原文估计方法可能产生的问题提供了善意的批评。下文中,我们仍将从学术探讨的角度,对原文的估计方法进行探讨和反思。
二、估计结果的准确性依赖于固定权重的假设
有批评观点认为:“国家统计局的物价数据系经过严格蹲点调查得到的第一手数据,然后进行加权计算得到。而报告中采取回归的推导方法,试图还原历史数据,这很明显违反了统计学的基本常识”。但是,桑得博士对原文采用估计模型的可靠性进行了测试:“假设权数不变,我们利用实际公布的8大分类指数,根据2001年基期的CPI分类权重,可以计算出一个固定权数的CPI(这个CPI和实际公布的CPI并不相等),将固定权数CPI作为被解释变量进行回归,估计出的系数和实际赋予的权重会完全一致,常数项为0。”这一点是比较容易理解的,在权重完全不变的情况下,只要样本存在变异,则所有的样本点都严格落在同一条直线上,因此估计结果可以完全准确的还原权重情况。
事实上,后文将表明,在对CPI编制方法有了完全正确理解的基础上,我们甚至使用了原文的估计式验证了CPI编制方法不存在问题。当然隐含的一个问题是,实际上8个分类权重并不是一直不变的,按国家统计局对CPI编制方法的介绍是“每年进行一次调整”的。那么,如果每年进行一次的调整是微小的,是否会对原文的估计式产生致命的影响?回答是肯定的,在下文中,我们将看到桑得博士提供了一个模拟的例子,说明了这种可能性。
三、对钱军辉博士批评的说明[③]:
钱博士的批评主要来自两个方面:(1)“常数项c的经济学意义是当X=0时,Y的均值(或期望),这个意义经济学家常常不感兴趣。……常数项不是误差,残差才是”。(2)“使用相同的数据,但是取基准为零,再次估计该模型。基准为零的意思是,原始数据为100,现为0,原始数据为103,现为3”。但估计结果发现:“常数项发生了显著的变化。代表可能低估程度的常数项由-7.53变为-0.11”,并由此认为原来的估计是错误的。
这两个批评都关系到检验的零假设问题。在一个理想的情况下,CPI指数编制完全按照8类权重进行加权计算,则对应的估计式应表现为:截距项为0,各项权重之和为1。桑得博士对原文估计模型的可靠性测试,已经证明了这点是可以检验的。因此,截距项为0,各项权重之和为1,这两点均应作为零假设,而不是事先给定的条件。则此时,假如常数项不为0,虽然不是统计意义上的误差,但却是CPI编制过程所无法解释的,因此常数项数值的含义还是我们感兴趣的。这是对第一个批评的回答。
对于第二个批评的说明:取基准为零(即所有的指数都减去100),这时的估计式和原有的估计式要等价是有个前提条件的,即“分类权重之和为1”。
当时上述两式是等价的,即(1)表示8个同比指数加权平均等于CPI总指数;而(2)式表示8个同比通胀率加权平均等于总体通胀率。但是当 时,上述两式就不可能同时成立。此时,用(2)式来进行估计,其结果和(1)式是不等价的。
因此,如果“分类权重之和为1”这个前提条件并不成立,则取基准为零的回归,与原文的回归得到不同的截距项是必然的。但是另一方面,“分类权重之和为1”仍然是有待检验的零假设,我们不能事先接受这个假设。所以,取基准进行回归的做法就不具有可行性。而原文采用CPI计算的定义式进行估计,则是有CPI编制制度作为依据的。
四、与桑得博士讨论的回顾:
如前所述,桑得博士[④]对模型的可靠性进行了测试之后发现:在权数固定不变的情况下,计量模型的检验是科学的。并由此认为:原文估计的分类权重总和偏离100%有两种可能(1)数据本身有问题;(2)CPI权数是变动的(包括制度性的变动)。然后,桑得博士使用了一个模拟测算对(2)对估计结果可能产生的影响进行了分析。她假设2006年权重和2001年权重相同,其后每年进行微调(如表1所示),再利用这些不固定的权重和分类指数计算各月的CPI(得到的非固定权重的CPI是严格按照加权平均计算出来)。
表1:假设的分类权重调整表
变量 | 系数 | 标准误 | t统计量 | P值 |
X1 | 0.707 | 0.031 | 22.691 | 0.000 |
X2 | 0.293 | 0.033 | 8.884 | 0.000 |
C | -0.010 | 0.790 | -0.013 | 0.990 |
R2值 | 0.997 | DW值 | 2.488330 | |
调整的R2值 | 0.997 | F值 | 8717.567 |
变量 | 系数 | 标准误 | t统计量 | P值 |
X1-100 | 0.707412 | 0.031176 | 22.69105 | 0.0000 |
X2-100 | 0.292680 | 0.032945 | 8.883895 | 0.0000 |
C | -0.001172 | 0.005724 | -0.204791 | 0.8386 |
R2值 | 0.997140 | DW值 | 2.488330 | |
调整的R2值 | 0.997026 | F值 | 8717.567 |