与其整天讨论子女AI,CS,数学,不如利用大选投票数据,让他们去验证本-福特定律,即教了政治又学了科学

来源: 叼虫小鸡 2020-11-11 15:56:21 [] [博客] [旧帖] [给我悄悄话] 本文已被阅读: 次 (1758 bytes)
本文内容已被 [ 叼虫小鸡 ] 在 2020-11-11 20:06:20 编辑过。如有问题,请报告版主或论坛管理删除.

所谓本福特定律就是Benford's law, 简单地说在一个大范围分布的随机数据中,以1,2,3,。。。。等开头的数字中,以1开头的应该占总数的30.1%左右, 以2开头的应该在17.6%左右,以此类推,9开头的应该在4.6%左右。也就是说每个开头数字应该符合P(n)=lg((n+1)/n), 而如果数据被人为修正过,则数据的分布要大幅度偏离本福特定律所对应的数字分布率。

你也可以自己找一堆随机数字来验证一下,当然,这些数字必须符合大范围随机的要素,比如说身高,体重,气温等就不符合,因为它们分布的范围不够大,比如,身高,普通人都是1米多,不会有3米的人,体重和气温等都有这样的问题,而电话号码更不是了,它是人为的有规律的数字。

而类似国土面积,选举人数等的数据却正好符合大范围,随机分布的要求,所以可以做为中学生,统计学或程序语言的Project,看看这次投票每个州中各县市的投票数据是否符合本福特定律也就是看看这些数据是否有人为改动的痕迹,也可以同时对比同一州,用往年各次选举的历史数据,来看看本次选举和历次选举数据间有何不同。相对来说这也是一个比较简单的学习project,比在网上show孩子数学成绩和编程能力,谈论将来学不学AI, CS要有意义。

所谓读万卷书,行万里路,知行合一是学习的终极目标。能进top学校的大多不是书呆子,特别是在美国。

 

 

所有跟帖: 

实在太同意了, 让孩子看看这个大选数据分析靠谱不靠谱,有python源码 -emplid- 给 emplid 发送悄悄话 emplid 的博客首页 (1323 bytes) () 11/12/2020 postreply 07:19:46

不明觉厉,佩服! -京城海鸥- 给 京城海鸥 发送悄悄话 (0 bytes) () 11/20/2020 postreply 19:36:13

请您先登陆,再发跟帖!

发现Adblock插件

如要继续浏览
请支持本站 请务必在本站关闭/移除任何Adblock

关闭Adblock后 请点击

请参考如何关闭Adblock/Adblock plus

安装Adblock plus用户请点击浏览器图标
选择“Disable on www.wenxuecity.com”

安装Adblock用户请点击图标
选择“don't run on pages on this domain”