国家统计局最近修订的就业数据讨论

2020年举行的第七次全国人口普查所得到的人口数据,曾经受到社会各界的广泛关注。国家统计局不但依据该次人口普查的结果修订了早先发布的2011—2019年的人口数据,而且也修订了其它许多数据。国家统计局在最近出版的《中国统计摘要-2021》“编者说明”中指出“2011-2019年人口数据根据第七次全国人口普查结果进行了修订”,而没有同时明确指出其它修订数据。本文仅仅讨论总就业数据的修订,说明普查后的2020年就业人数和普查前的2019年就业人数相差过大,使得以往各年的年度统计丧失了可靠性,并迫使国家统计局修订2011-2019年就业数据。但如此一来,依据那些年度统计数据所做出的无数市场分析和实证研究(包括本科硕士博士论文)便沦为无效劳动。本文呼吁国家统计局采取措施,把年度就业统计提高到令人基本满意的质量水平。

下面的表1列出了国家统计局对2011-2019年全国就业的修订数据。与此相对照,表1也列出国家统计局直到2020年所发布的该时期年度数据(即“普查前数据”)。表1同时列出两套数据之差和其占修订数据的比重。

表1 全国总就业:修订前后数据,2010-2020年

                                               单位:万人,%

表1的第3栏清楚显示,2011-2019共九年的修订数据不但全都小于普查前数据,而且“小于”的绝对数和比重全都逐年提高。到该期间的最后一年即2019年,修订数据比普查前数据少了2,000余万人,接近修订数据的3%。我们知道,普查前后的两套总人口数据的差异曾经引起许多争议。然而,普查前后的两类总就业数据差异比两套总人口数据差异还大得多。例如,2019年总人口数据在普查前后相差1,003万,而该年总就业数据相差2,024万,是前者的两倍多。如果考虑就业人数远远小于总人口,那么,就业数据的质量更远远次于人口数据的质量。

比数据差异更重要的是趋势变化差异。我们用下图揭示普查前后的两套数据所代表的全国就业总趋势。两条就业曲线的比较说明,如果普查后修订的数据更符合事实,那么,全国总就业从2011年就开始低速增加并在2015年便转而减少。全国总就业最高峰是2014年的7亿6千3百多万,之前和以后皆没有超出7亿7千万;而根据普查前的年度统计,全国总就业在2017年甚至超过了7亿7千6百万。因此,国家统计局在2021年前发布的年度就业数据,大大高估了就业增加的趋势,造成了严重失真。

图1 2020年普查前后数据揭示的总就业趋势,2010-2019年

不过,2020年普查发现的就业数据问题不是新鲜事。同样问题也出现在2010年人口普查时。以2000年普查后数据为起点,图2绘出2010和2020两年人口普查前后数据的曲线。这些曲线清楚地表明,国家统计局在本世纪以来的二十年内,总是高估甚至严重高估全国的就业人数,以至于到了普查前一年即逢九年份,普查前的就业人数皆比普查后的就业人数多出2000余万,相对差异皆近于3%,迫使统计局不得不对前九年发布的数据大幅度地加以修订。

图2 2010和2020两年普查前后的就业数据,2000-2020年

一些读者可能觉得“迫使”一词用得重了:统计局修订数据是为了我们好,而非“不得不”。应当说,仅仅总就业数据失真还难以说明统计局修订数据之“不得不”,可用就业增量和增长率来说明便很清楚。比如从南京开车到上海,300千米用了三个小时。但驾驶员把最初两个小时的速度说得太快,每小时便达到150千米,则按他的逻辑,第三小时他或者休息或者必须倒车一段路程后再开。由于他既没有休息也没有倒车,所以他在前两小时的时速肯定达不到150千米。统计数据的问题也是如此。市场分析和理论研究用到的不仅是总量数据,而且是它们的增量和增长率,后者对于研究和分析尤其重要。下面的图3显示2000年以来中国就业的增长率。很清楚,因为前九年数据过大,若不修订,逢十年份的就业增长率将是无以为信的过小负数,若不倒车,不修订数据,逢十年份的数据太失真,数据系列更是无法继续下去;但踩倒车,修订数据,把逢十年份的巨大失真分散到前九年,则又把利用前九年数据进行的市场分析和理论研究置于极其危险的失效境地。仅就直到今年夏季通过答辩的近几年全国经济学管理学专业的本科硕士博士论文来说,只要它们严重依赖国家统计局逐年发布的2011-2019年的总就业(以及城乡就业和三个产业就业,因为总就业一变,这些分项就业数据必须随之而变)数据,它们的研究结论从而整个论文就可能作废。所以,说一千道一万,国家统计局面临的一个极其重要的挑战,便是采取措施,从根本上把日常和逐年的人口与就业统计提升到一个基本符合研究要求的质量水平上,而不再需要每十年大规模修订一次数据。我衷心希望,十年后我还算健康,能够看到2030年的普查数据和直到2029年的逐年统计数据基本契合,而不会重蹈2010和2020两年普查后的覆辙。

图3 2010和2020两年普查前后的就业增长率,2000-2020年

“夜话”2021年第9期,2021年8月8日

参考文献

普查后修订的总就业数据:国家统计局,2021,中国统计摘要-2021, 4-2。

2001-2009年逐年总就业数据:国家统计局,2010,中国统计年鉴-2010, 表4-3。

2011-2019年逐年总就业数据:国家统计局,2020,中国统计年鉴-2020, 表4-2。

“国家统计局最近修订的就业数据讨论”的2个回复

  1. 四の宮:
    您好!谢谢您,谢谢您的关注和留言,谢谢!由于我最近自己没有关注自己的个人网页,因此耽误了给您的回复,对不起,对不起!
    您说得对,各种小道消息,您自己真實的見聞,以及普查過後的许多政策,都让人对公布的人口数据产生疑虑,拙文在就业数据做了些许对照。这里,如您所说,数据是否真实可靠的讨论竟然也成了禁忌,这不禁让人扼腕长叹!
    再次感谢您!
    胡景北

  2. 其實這次疫情過後,無論是漫天的小道消息亦或自身真實見聞都明顯感覺城市人口密度明顯下降,而經濟因素應該不至於有如此大的勸退力度,再加上普查過後的奇奇怪怪開展的政策,結合先生對數據的敏感,晚輩一個極其不成熟的關於人口真實數據的想法—-大概您也懂得這可能觸犯禁忌,就不直言了

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注