高分太多凭啥要改低?不能以“正态分布”导致“内卷”
因为一高校教师与教务办的争执,让“正态分布”这个数学概念火了一把。正态分布是啥?为什么有这么大的威力?
日前,中南大学软件学院的特聘副教授吴嘉在网上吐槽说:教务办要求自己将50名学生成绩从90分改成80分,理由是高分太多,不符合正态分布。吴教授不同意更改分数,表示学生得多少分是考试的结果,考了多少分就是多少分,自己不会为了让成绩符合所谓“正态分布”而刻意压低学生分数。吴教授质疑教务办对教学进行行政化干预。中南大学软件学院后来回应称成绩无误,教务办和任课老师都是认真负责的,只是沟通上有误会,已经解除。
据了解,吴老师这门课程参考人数是153人,期末最终成绩90至100分占比70%以上,几乎没有低分。其中,平时成绩全部都在95分及以上。吴老师将成绩单提交学院审核时,教务办发现成绩分布异常,提醒老师复核。
那么啥是正态分布?为什么教务部门会觉得学生成绩不符合正态分布可能有问题?
正态分布是统计学上描述随机变量取值规律的一种情形。在这种分布下,随机变量的值呈现中间高、两头低并基本对称的规律,也叫高斯分布、钟形曲线。正态分布是一种很重要的概率分布,在大样本量统计中,有很多变量的分布都符合或者近似符合正态分布。比如全体中国人的身高、体重,比如某一年的高考成绩。正态分布表示的规律,是变量的取值大多数都在中间水平,非常高或者非常低的取值是比较少见的。这个分布规律当然是科学的,也在很多大样本量统计中得到了验证。所以正态分布在很多场合被用来校验变量的分布是否合理。在中南大学这个例子中,教务部门就认为,学生成绩应该大体符合正态分布,如果偏差太多,像吴老师课上90分以上的学生占比超过70%,就不太正常。
但问题在于,正态分布是在大样本量统计之下变量分布呈现的规律,当样本量较少的时候,数据呈现的规律可能与大样本量下的规律不同。因为在小样本量之下,变量的分布可能受到其他因素的影响比较大。
比如考试成绩,从全国甚至全省的统计来看,某一统一考试的成绩是符合正态分布的,但是具体到某一个班级,不排除这个班级全是学霸或者全是学渣的可能性。这样一来,单看这个班级的成绩,不符合更大样本的正态分布,但是也不能说这样的成绩就有问题。比如某市某年中考,某知名初中高分学生很多,其学生成绩分布,明显高于全市考生的成绩分布。能说这所学校的成绩有问题吗?可能只能说明这个学校的学生成绩好。当然,如果把这所学校的考生成绩单独拿出来做分析,也是基本上符合正态分布的。就是说,这个小样本的数据自身是正态分布,但是与更大样本下的正态分布曲线不同,其均值μ要高得多。但是当样本量再小一些,具体到某个班级甚至某个几人小组,其成绩不符合正态分布可能就很常见了。
总而言之,正态分布是在很多大样本统计中都存在的规律,这是科学。但是如果因此认为包括小样本量统计在内,所有类似领域的统计都应该符合正态分布,而且还要和大样本量的正态分布曲线一致,那就不科学了。
然而,就像中南大学一样,还有很多高校也在一刀切地要求每个班级的学生成绩都要符合“正态分布”,也就是强制要求限制高分以及低分的数量,不能超过某一比例。
不只是学校,很多公司在员工考核中也有比例规定。而这,可能是当代中国“内卷”越来越严重的原因之一。
比如某知名互联网大厂在考核中有271原则,20%的员工优秀,70%合格,剩下10%不合格,要被淘汰。在每一个超过10人的团队中,都必须贯彻271原则。在几千几万人的全体员工范围内,后10%的员工可能是效率较低的,但是当考核范围缩小到一个10人的小组,那完全可能所有人都在全公司的20%以内,但是这个10人小组也要找出1个来淘汰。这就逼着大家都要拼命工作,拼命竞争,但最后还是要有1个人被“内卷”的系统淘汰。
这种末位淘汰的制度本身是否合理呢?在员工签署的劳动合同中,员工的职责都是完成规定的工作任务。这个工作任务,到底是静态的,还是动态的呢?在静态工作任务的情况下,比如某公司对销售人员的考核指标是年销售额1000万元,那只要超过这个销售额就完成工作任务了,完不成就会被淘汰。但是如果是动态的,是跟同事比较之下的表现,就可能出现所有销售人员都完成1000万元销售额,但是销售额最低的那个,还是要被淘汰。在第二种情况下,员工除了有底线任务的压力,还要和同事竞争,要比同事更优秀,否则就要被淘汰,被迫内卷。
所有的考核,基本都可以分为两类。一类是资格性的,事先划定标准,只要超过标准,就是合格,另一种是竞争性的,标准是事后确定的,只有在一定比例以上才算合格。在前一种考核中,虽然最终成绩可能也是正态分布,但是有可能所有人的成绩都超过了合格线,全部合格,而在后一种竞争性考核中,却是无论整体如何优秀,都要有一部分人要被淘汰。正是这种残酷的淘汰,导致了越演越烈的“内卷”。
辛省志