陈沁:纯数据分析高考上一本或二本 毕业五年十年后收入差距多大
原标题:陈沁:纯数据分析,高考上一本或二本,毕业五年十年后收入差距多大
2020年6月29日,昆明一中学,初三年级学生高喊口号为高三学长学姐加油。来源:视觉中国
文 | 陈沁 (数联铭品首席经济学家,毕业于复旦大学,曾任教于复旦大学经济学院)
一本学校和二本学校毕业生,未来的就业会在多大程度上因学历而拉开差距?换句话说,如果一个人本来可以读一本,但是出于各种原因而读了二本,那么他/她未来的就业乃至人生会因此改变多少?
首先得承认,回答这个问题并不容易,因为:
我们没办法让同样的一个人经历一遍一本,再经历一次二本,然后让这同一个人来述说两者的差异;直接用上了一本的一群学生和上了二本的一群学生比较,说前者的工作、收入都比后者好,所以一本好,这也不对。因为我们没法确定他们的人生走向不同是由于学校差异带来的,还是由于自身差异带来的——毕竟两者在高考考分上就有区别。个体的比较和个例的举例就更加没有说服力了。
因此,这个问题需要我们使用RDD方法(Regression Discontinuity Design)来研究。RDD中文为断点回归,即比较断点两侧的情况,看有没有出现突变。
对于高考来说,断点回归十分合适。首先,高考考分是连续的,从0分到750分,一分一档;其次,高考考分具有一定随机性,一个水平在500分左右的考生,在高考时勉强超过500分(少错一题),和刚好低于500分的概率是差不多的(多错一题)。
由于连续性和随机性这两个性质,当两个学生的分数只差1分时,我们很难断定,这两个学生谁会在未来的就业市场上表现更好。
除非,这一分刚好处于一本线上。
一本线上和一本线下,学生的录取完全就是两个流程。
线上1分的学生当然可能因为志愿填报问题而落榜,到二本去。但总体来说,他/她还是有不少概率能读一个一本学校——虽然专业可能并不理想。
但对于线下1分的学生,他/她可以选择二本学校中的好专业,但几乎没有什么就读一本学校的机会了。
因此,由于一分的差距,把一群并没有本质差异的学生分成了两组,一组在线上,一组在线下。如果此时这两组学生的未来人生走向出现差异,那么就可以说这个差异是由学校带来的了。
一、一分之差带来的工资差异有多少?
贾瑞雪、李宏彬在2017年的文章《The Value of Elite Education in China》首先对这个问题给出了解答。他们使用CCSS数据进行研究。
“中国大学生学习与发展追踪研究”(China College Student Survey,CCSS)项目是清华大学教育研究院于2009年发起的全国性大学生学情调查。该项目由清华大学教育研究院史静寰教授主持,在来自教育研究院、经管学院、社会学院等多个院系研究人员的积极参与和推动下,形成了一套以学生为中心、关注学习过程、全面考察学生的学习和未来发展的科学有效的研究工具。调查覆盖从生源输入,学习过程到就业出口的全口径数据,力求全面准确地反映院校本科教育的质量和动态。截至2016年,累计已有147所高等院校参与了本项目调研。
CCSS询问了全国四万多名在校毕业生的就学和就业情况,使用毕业班学生截止至调查前的最好一份offer的工资,再取出当年高考时在一本分数线上下20分的学生,贾瑞雪的文章做出了下图:
上图的红色虚线代表每个学生当年高考时的一本分数线,横轴表示的高考成绩比一本线高出20分或者是低20分,左右两图的纵轴分别为工资水平或者对数工资水平(去除了毕业年份与工作省份的固定效应)。
从图中可以看到,在虚线两旁,工资水平出现了一个跳跃,这个跳跃的高度大约为122元工资,或者是6%的工资增长。
因此,如果高考提高1分,从一本线以下一分提升到一本线,这名学生在毕业时拿到的offer就会提高122元!
二、一本和二本,只是差122元吗?
看到这里你可能会想,只是122元,有什么了不起呢?
的确,如果仅仅是122元的毕业工资提升,那么可能确实不能说明一本比二本好多少。
但我们需要注意一点:达到了一本线,只是理论上让你能进入一本院校,但并非一定能被录取。比如志愿没有达到所填专业的分数线,又没有服从调剂,或者是主动选择了二本院校等情况都可能出现。
因此,高于一本线,只是“提升了你进入一本院校的概率”。贾瑞雪等的论文也做出了下图:
红色虚线仍然代表一本线,纵轴代表能够进入一本高校的概率。可以看到,虚线左边进入一本的概率的不足5%,到右边就立刻跳跃至20%左右。
虽然分数线左右导致进入一本的概率有一个显著的跳跃,但远非从0%到100%那样直接,而是在一个几十分的分数段内,有一个被录取到一本院校“概率逐渐提升”的过程。前文的122元,与其说是“一本和二本的工资差距”,不如说是“考分高于一本线1分使一本录取率提升15%带来的工资差距”。
因此,122元,或者是6%,只是比较了一本院校录取率为20%和录取率不足5%的两组学生的工资差异,低估了一本院校带来的工资影响。
要估计一本院校的工资溢价,我们实际上需要估计的是:
这是一个二阶段回归,首先用高出一本的分数回归是否录取一本,取得其系数后再算出每一个分数被录取一本的概率,再用此概率回归高出一本线的工资差异。
贾瑞雪等的论文算出,这个差异大概是30%-40%。或者说,700-1000元。这就是一本院校和二本院校的学生,在毕业时的工资差距。
三、这个工资差距,是来自个人能力,还是来自学校品牌?
到了这一步,读者可能还会有疑问——一本院校和二本院校,由于学校品牌的差别,在毕业时当然存在工资差距。因为用人单位在招聘应届毕业生时仅能通过学校的品牌来判断个人的能力。
这确实是对的:毕业时的工资差异,并非来自个人能力的差异。贾瑞雪的论文发现,一本院校的毕业生工资更高,可能并不是因为他们能力更强。作者检验了这批学生的四级考试成绩、计算机等级考试、注册会计师考试等,发现在一本线上下的学生中:
英语四级考试成绩,一本线上线下学生没有差异;计算机等级考试,一本线上线下学生没有差异;注册会计师(CPA)考试线上学生还要低于线下学生;……
所以,一本学生在毕业时比二本学生领先的30%-40%的工资,更可能来自学校的品牌以及他带来的更好的社会关系——比如更多的实习机会。因为即使一本学生有更好的个人能力,用人单位上也无法在简历上通过这类证书识别出来。
四、未来的差距,是扩大了,还是缩小了?
由此可见,一本和二本实际上有很大区别,但是未来呢?是不是随着时间推移,学校的品牌的决定能力降低,此时决定工资的,应该是个人能力?也就是说,毕业后通过努力工作,能否弥补由学校品牌带来的差距?
答案是,不能。不仅如此,大概率的情形是,差距不仅不会缩小,还会扩大。
上文全部引用了贾瑞雪的论文,他们使用的CCSS数据使得研究只能局限于毕业当时的offer情况,却不知未来会如何变化。但中国还有另一份数据询问了高考情况,那就是CHIPs,中国家庭收入调查,全称为China Household Income Projects。
2014年7-8月份,中国居民收入项目进行了第五轮全国范围调查,主要收集了2013年全年的收入和支出信息,编号为CHIP2013。本轮调查得到国家自然科学基金资助和国家统计局的支持,由北京师范大学中国收入分配研究院联合国内外专家共同完成。具体的调查过程由国家统计局城乡一体化常规住户调查办公室执行。
问卷中有这样的问题,记录了每一名受访者的高考年份、类型、分数、地点。
我另外搜集了从1998年至2018年所有年份各省文理综合卷的一本分数线,很多年份已经很难收集,但一些较早年份,由于当时的全国高考试卷仍然统一,也呈现出了不少有趣的点,比如1999年是这样的:
言归正传。
我们先使用CCSS的部分数据,用同样的方法重复了贾瑞雪的论文。将带宽扩大后,显示如下:
上图我将带宽扩大到了上下200分,此时一本学校和二本学校的工资差距,用断点回归方法可以算出约6%的差距,可以理解为两条直线在一本线上的截距之差。若是使用二阶段回归,结果为30%。两个计算均与贾瑞雪论文得出类似结果。
上图是刚毕业时的工资差异,用CHIPs数据,我们就更加自由一些。CHIPs可用的两次调查发生在2008年和2014年,有12790名被访者曾经参加过高考,其中6619名被访者的高考时间发生在1998年之后,可以和我之前搜集到的1998年之后的分数线匹配起来。
在这六千多名在1998年之后参加高考的被访者中,有2268名被访者,在调查当年已经毕业了五年以上。使用这部分被访者的高考数据和工资数据,我可以识别出毕业五年后的工资差异,结果如下:
即使用肉眼也能清晰地看到,一本和二本之间的断点,比刚毕业时扩大了。
由于CHIPs样本远少于CCSS,因此上图的点较为分散,但上图的断点回归是非常显著的:从二本到一本,两者之间的工资差距为24%。如果用二阶段回归,先估计进入一本院校的概率,再用概率回归工资,则一本和二本的差距高达90%。
同时我们从上图还可以看到一个可怕的现象:
只有一本线的右边,才存在着“工资随着高考考分提升”的趋势。在一本线的左边,从比一本低200分,一直到一本线附近的这么大区间里,人们的工资都是差不多的。
如果进一步观察十年后的差距,则有下图:
虽然样本进一步变得稀疏,但一本线上下的差距也变得更大、更显著了。
简单总结如下:
使用断点回归观察一本线相邻的工资差距——刚毕业时,两者的差距是6%;毕业五年后,差距扩大到24%;十年后,差距扩大到34%。使用二阶段回归考虑进入一本院校的概率后估计一本院校带来工资差异——刚毕业时,一本学生比二本学生工资高出30%-40%。毕业五年后,这个差距扩大到了90%。十年后,差距扩大到110%。更重要的是,考试成绩和工资的关系,只在一本线以上存在。只要你在一本线以下,不管是差一点点就到一本线,还是差200分才到一本线,五年、十年后,你们都会踩在同一条终点线上。
因此,不要相信“一本和二本没什么区别”之类的安慰。如果你的水平正处于一本和二本之间,那么还差十天,好好复习,考好高考,考上一本,才是你现在最应该完成的任务。高考一考定终身,一分的差距,决定了未来十多年的两个世界,此言非虚。
责任编辑:赵慧芳
曾造成上亿人死亡,“天花病毒”惊现美国药企实验室,FBI紧急调查
来源:每日经济新闻11月20日,“天花病毒”冲上热搜榜第一,引发网友关注。据外媒报道,当地时间11月17日,美国国土安全部称,在美企默沙东公司宾夕法尼亚州疫苗研究机构的实验室冰箱内,发现了几个标有“天花”字样的冷冻小瓶。美国疾控中心(CDC)与联邦调查局(FBI)正在紧急调查此事。0001胰岛素首次国采结果出炉,专家:里程碑事件,价格降幅超预期
11月26日,第六批国家组织药品集中采购(胰岛素专项)在上海开标,产生拟中选结果。这是国家组织药品集采首次拓展到生物药领域。巧合的是,今年正是胰岛素发现100周年。本次胰岛素专项集采涵盖临床常用的二代和三代胰岛素,包括16个通用名品种,11家企业的42个产品拟中选。以每支胰岛素注射液3毫升规格计算,中选产品价格均降到每支80元以下,部分中选产品低于每支20元。拟中选产品平均降价48%。0000成龙退出林凤娇公司 新增廖柔雯
天眼查App显示,近日,北京中泰龙威房地产咨询有限公司、艺房紫(北京)文化传播有限公司接连发生工商变更,陈港生(成龙)退出,新增廖柔雯。两家公司均成立于2007年2月,法定代表人林凤娇,且由林凤娇全资持股。{image=1}{image=2}{image=3}责任编辑:王蒙0001国务院国资委主任郝鹏调研中国航天科工航天三江激光产业
e公司讯,中国航天科工消息,3月27日,国务院国资委主任郝鹏一行深入中国航天科工所属武汉光谷航天三江激光产业技术研究院有限公司睿芯特种光纤生产车间调研,详细察看产品生产工艺和产品应用情况。郝鹏表示,要持续提升自主创新能力,力争在关键核心技术上取得突破,助力科技自立自强;进一步整合资源,加快国产核心技术应用,加快形成产业链上下游合力。责任编辑:王翔00002020年我国卫星导航与位置服务产业总体产值将超4000亿元
中国卫星导航系统管理办公室主任冉承其表示,10年来我国卫星导航与位置服务产业总体产值年均増长20%以上,2019年达到3450亿元,2020年将超4000亿元。责任编辑:尹悦0001