这种调查的原理是:每个品牌的车故障率都是一个正态分布,通过取样可以测这个分布的平均值。这个分布也有一个标准方差,假设是 s,那么取N个样本平均值的方差就是 s/sqrt(N)。样本越大,平均值的方差就越小,意思就是对这个平均值的估算越准确。
那么怎样对两个品牌排名呢?只比较平均值是不够的,还要看两个平均值的差别和它们的方差大小的比较。一般说来,如果平均值的差别大于两个方差相加的两倍,那么统计上就有95%的把握说一个品牌比另一个更可靠了。如果平均值差别不变,而方差变大,那么我们的把握度就减小。这就和样本大小有关了,有些小众品牌(比如Ferrari)不在报告内,不是说一个样本都取不到,而是样本数量太小,平均值方差太大,使得和任何其它品牌相比都达不到足够区别的把握度。
JDP每年都汇报总样本数目,2023年是3万个,一共30个品牌,平均每个1000个样本。当然,高档品牌如Lexus肯定样本小不少。那么两年间平均值那么大的差别,一个解释是Lexus真的把质量提高了很多,另一个是样本其实还是太小,平均值方差太大,在两年的取样上体现出来了。后者更可能反映真实情况。
那么第一个结论就是,JDP在统计方法上不严谨,没有把每个品牌的样本数和平均值方差汇报出来。一旦他们这样做了,有数学功底的读者就会发现对于很多小众品牌经常是样本太小,他们对所有品牌的排名其实是无法有一致的高度把握的。
另一个结论呢,我们反推一下。Lexus两年平均值差别达到了12,那么这个平均值的方差可以大约估算在6。Lexus不是太过小众的品牌,按和平均销量比估算,200个样本总是有的。那么反推的话,原本故障率的方差就在6*sqrt(200)=80,这是对每100辆车的,每辆车就是方差0.8个故障。假设所有品牌每辆车的方差都差不多,哪怕把Lexus和最差的Land Rover比,每辆车故障率差别是2.73-1.33=1.4,方差和是1.6,达不到统计上区别开的把握度(需要大于方差和的两倍)。
所以说,个人每次买车,在买一辆车的情况下对两个品牌比较,JDP这种报告没有太大统计意义,最终买得好坏和掷色子差不多。不如只看性能、安全性、驾驶乐趣等不带随机性的指标。