余命

来源: meowzilla 2014-06-06 11:40:17 [] [博客] [旧帖] [给我悄悄话] 本文已被阅读: 次 (13992 bytes)
原作:佚名/日本网友

编译:StarKnight

这个故事并非什么能把人吓到屁滚尿流的恐怖鬼故事,只不过偶尔回想,还是令人脊背发凉,所以不妨写下,供诸君一阅。

已经是好几年前的事了。当时,我是一家企业的研究团队的一员。

说是研究员,但并非穿着白大褂、调试各种药剂的那种研究——我们做的是基于监控录像的人脸识别系统,及其相关应用。

比方说,在电脑主机上搭建一个程序,然后向它输入大量的监控摄像头数据,最终,程序通过人脸识别,输出诸如「ID:0001 ,通过点:X→Y→Z」这样的记录(log)。

当然,这种程度的功能,市面上已经多得很了,我们要做的是,尝试在此基础上,逐渐追加各种功能,看能不能获得什么意外成果。

最先开发的是「年龄判断」功能——大概不少人听说过。

基本原理和天气预报差不多:预先在系统内存储数千组人脸/年龄的数据,当摄像头读取到动态的人脸时,基于预存的数据,给出一个预想值。

这个方法不算复杂,但精度却不低。在试验阶段,就能猜中40%左右,其余的误差保持在±8岁之内,很有意思。

但若仅是「年龄判断」功能,也已经有不少地方在做,于是我们继续努力,想做出一点更加独特的功能来。

幸好,我们研究室手头有不少原始资料,包括人物的照片,名字,年龄,籍贯和学历,等等,可供我们做各种试验。

猜名字的功能我们放弃了。那么离散的数值让电脑来猜,委实有点困难。

令人惊讶的是,「看人脸猜学历」(学历分为四档:初中/高中/普通大学/一流大学毕业)竟然有高达60%的准确率。

「看人脸猜籍贯」(让电脑将冲绳-北海道作为一个连续的值来判断),则有将近10%的准确率。

——可能有人会想:「什么啊,才10%而已?」但这其实是个很了不得的比率。

让人看脸猜年龄,准确度也许超过电脑,但光看脸猜别人的籍贯,10次中未必能中1次。

总之,这里想说的是,只要给予电脑足够多的样本,程序的推算精度还真的不容小觑。

闲话少叙,书归正传。

当时,正是《死亡笔记》正流行的时候。可能是受了这部作品的影响,我们团队里一个喜欢异想天开的「疯狂科学家」(姑且称他为A吧),提议说:「我们来做做看寿命预测吧」。

显然,我们手头的照片资料内,是不可能有「剩余寿命:XX年」这一栏的。

A说:「我们可以用历史人物的照片。有些是黑白的,应该不会对识别精度有太大影响,没关系的。」

确实,黑白照片的识别精度虽没有彩照来得高,但对人脸识别程序的影响不会太大。

「不过,光用历史人物照片,样本数恐怕不够吧?」

「不一定非要是名人,只要有大头照,摄影年份+死期就可以了啊,所以天灾或者事故的死者也可以拿来用的。」

「等等……那岂不是会混进去很多因为外部原因而死的样本?」

「没关系,要的就是这个效果!」A笑眯眯地说。

——原来这家伙想要的效果,不是「通过对象面貌,推定其健康程度,进而预测其寿命……」而是想让电脑完成摆摊算卦的相面先生的工作。

我对于拿死人的数据来做样本这事儿,多少有点抵触,但那时大家都是好奇心旺盛的年轻人,于是马上就动手开始做了。

每天一点一点地将照片、死亡年份-照片拍摄年份(=剩余寿命)的数据录入电脑,过了几个礼拜,样本数达到了2000多个。

于是,我们进入了实验阶段。说是实验,但因为不知道正确答案是多少,谁也没法验证其是否真的准。

第一个实验对象是我。大家启动了系统,让我站在摄像头面前。

很快,摄像头找准了我的面部,隔了几秒,系统画面上弹出了一个答案:

余命:60。

嗯,现在日本男性的平均寿命大概是80来岁,这个答案也不算那么离谱嘛。

(忘记说了。我们团队里的成员都是二十来岁,只有组长三十挂零)。

接着,其他组员也都拍了照,得出了各种结果。

可能是因为样本数还是不够多,答案差异非常之大:

23、112、75、42……有些实在太离奇了。

其中最刺激的结果是A,他的测算结果是「0」。

看起来,实验是失败了。让电脑做算命先生的活,还是力不从心。

不过那2000多个样本是大家辛辛苦苦手动录入的,自然要看看能不能在别的地方派点用场。

于是,我们将程序调整到log记录模式,然后将公司服务器上保存着的各种监控录像数据导了进去。

数据导入花了一整晚。第二天,电脑输出了数千个辨识log。

我们将log数据作了一番统计处理,发现了一些有趣的现象:

随监控场所的不同,余命的数据差别也非常之大。

比如说,小学的场景,电脑推算出的登场人物余命均值是「106」。

这个数字远远超过全部记录的均值「46」。

相反,低于该均值的数据来源,则是高速公路的服务区监控录像:平均值为「38」。

这是不是说明,开车或坐车的人,早死的风险比较大?

按照由多到少的顺序往下翻,倒数第二位的,是本地的一所养老院的录像,平均值为「15」。

倒数第一位呢? 如你所猜想的,是医院。平均值居然只有「4」!

等等,好像不大对啊。就算是医院的录像,平均余命只有4年也太不自然了。

比如说,住院患者中一定有因为参加体育活动受伤的少儿吧,他们的余命应该很长才对。

为了确认是不是什么地方出了差错,于是我们调取了原始数据。

一看,当时就惊着了。

原始数据的格式是这样的:

「ID:1234 VALUE:34(← 在这里,VALUE的值即为推定余命) …」

像这样一条条的数据在屏幕上排开,绵延不绝。大部分是很普通的数字,比如「34」或「50」等等。

可是,其中夹杂了几个不可能存在的数——

负数。

以防万一,我们调出医院以外的原始数据来看,发现其他场所的log里面,也有几个负数的记录,但绝对数量比医院少得多。

——如果按照字面意义来解释,即是「余命=-3年」,也就是「已经死了三年」。

——所以,医院里探得的数据,负数特别多,所以导致余命的平均值也大为下降。

……我们努力想要保持冷静,但冷汗已经把衣服湿透了。

之后,团队成员开了几次会,觉得只能得出两个结论——无论哪一个都令人丧气。

即,1)让电脑测算余命,误差太大,没有信服力;

或,2)我们的周围,有余命为负数的人在昂然阔步。

当然,最终我们采纳了第一个结论。对于整个实验,我们拟了一份报告,随便起了一个《利用人脸辨识程序调查健康状态的可能性》的名字,上交给了领导(这倒是事前就计划好了的)。

这个项目就此打上封印。

我们每天都要与数百人擦肩而过,目光交错。

谁知道其中有多少张脸,是「余命为负」的?

还有一件重要的事情忘记写了,补上。

被电脑推算出「余命为0」后不到一年,A死了。

上班高峰期,他从站台上跳下了铁轨。

电脑是怎么预测出来的?

谁也搞不懂。

我们提供给电脑的信息,只有「样本」与「测算对象的脸」而已。

可是A确如电脑宣告的那般,如期死去了。

有一个词,叫「死相」。

有些异能人士,看人的脸,就约莫能知道,「这个人快死了」。

我对超自然的事情不大感冒,但自从A死后,我开始非常害怕靠近监控摄像头与拥挤的人群。

还有,只要不是逼不得已,我也绝不靠近医院。

<完>

所有跟帖: 

有意思。余命是负数。 -笑含- 给 笑含 发送悄悄话 笑含 的博客首页 (0 bytes) () 06/06/2014 postreply 16:43:21

因为人体放光,镜头是测光的。人命将尽,光也就暗了。 -astermatch- 给 astermatch 发送悄悄话 astermatch 的博客首页 (0 bytes) () 06/06/2014 postreply 20:35:26

没事别总算命。。 -Lionqueen - 给 Lionqueen  发送悄悄话 (0 bytes) () 06/07/2014 postreply 18:12:58

co.没事别总算命。。。不过这余命说法是少见,有点意思。 -玉珠- 给 玉珠 发送悄悄话 玉珠 的博客首页 (0 bytes) () 06/13/2014 postreply 04:16:21

请您先登陆,再发跟帖!