从波音飞机事故说起 --- 我经历的软件出错噩梦

来源: VCPP 2019-04-05 20:06:57 [] [博客] [旧帖] [给我悄悄话] 本文已被阅读: 次 (3279 bytes)
本文内容已被 [ VCPP ] 在 2019-04-05 20:22:55 编辑过。如有问题,请报告版主或论坛管理删除.

这是三个星期之前写的,那是早上,刚写好这个软件crash的文字,下午开车就经历了crash, 于是再没心思贴出。现在稍微缓过来一点,提醒各位:开车注意安全,平安是福,此言不虚。
 

波音飞机坠毁,引发全球关注。波音昨天(3月17日)宣布,已完成最新软件更新,说明事故的确跟软件有关。我能想象,自从出事以来,波音搞软件的人经历的巨大压力:赶紧查找原因,必须限时完成。最难的是,无法实际测试,一切只能靠模拟和分析,总不能为了排查错误,真摔一架飞机。这方面,我有过痛苦不堪的经历。

我们公司开发的是监控大型石油天然气管道的软件。24小时实时运行,一定要关停软件的话,最多只能半小时。偏偏软件质量太差(主要是人的问题),以前我笑话过国内某通信公司现场改软件的做法,那时在我的“老东家”,加拿大百年老店北方电讯,软件都是经过最严格的设计、反复测试,发布以后,偶尔一年才会出个错。软件出错之后,决不能马上修改,因为这时出的错,一般已经不是简单的错误,基本与设计或者实际因素有关,匆忙改动,很有可能改坏其他部分,必须备案,研究分析之后,才确定如何修改。这样做出的软件,质量不是一般的高。各位打手机,没出现掉线吧?那里面有我们的努力和智慧呀,哈哈.

换到现在这个公司后,完全没有这一套,用户一句话,你说咋办就咋办。结果,有一次,我参与的一个大项目,投产之后,立马出现软件崩溃。要命的是它随机发作,每次重新启动后,有时隔半天,有时就是一两小时,突然崩溃。想了各种办法,花了星期四、五两天时间,再加整个周末熬到半夜,还是不知道怎么回事。大家纳闷:以前在老系统上好好的,怎么换到微软的新系统上就不行了?

用户骑虎难下,不得已,只好安排一名员工晚上加班看守,一旦出错,立即人工重启。NND,软件做到这个份上,耻辱啊!到周一,我觉得不能再这样盲人摸象。静下心来,把源程序拿来 (别人写的),密密麻麻两三千行,一个字一个字看了一遍。最后锁定其中一行,肯定就是祸根,就是一个没脑子的简单错误。修改好放上去,果然止住流血,一干人总算松口气。

后来,我在其他项目的程序里也看到同样的错误,赶紧修改,免了几场灾难。

所有跟帖: 

软件这东西还是本专业的写才好 -3-D- 给 3-D 发送悄悄话 3-D 的博客首页 (0 bytes) () 04/05/2019 postreply 20:14:40

北电、朗讯等等,某种意义上是逆淘汰出局的例子 -松涛孤雁- 给 松涛孤雁 发送悄悄话 (0 bytes) () 04/05/2019 postreply 20:18:05

您有见地! -VCPP- 给 VCPP 发送悄悄话 VCPP 的博客首页 (0 bytes) () 04/05/2019 postreply 20:28:40

现在很多公司structure升级,都大量雇佣印度consulting公司派来的contractor,出事是早晚的事,轮到谁,谁 -katies- 给 katies 发送悄悄话 (204 bytes) () 04/05/2019 postreply 20:34:57

说起印度contractor,我早想写他一篇。 -VCPP- 给 VCPP 发送悄悄话 VCPP 的博客首页 (107 bytes) () 04/05/2019 postreply 20:39:29

我们雇很多印女testing,发现有的把100%testingsuccessful,hardcode在script里,当然发现后 -katies- 给 katies 发送悄悄话 (81 bytes) () 04/05/2019 postreply 20:42:33

"hardcode在script里", 开国际玩笑啊! -VCPP- 给 VCPP 发送悄悄话 VCPP 的博客首页 (0 bytes) () 04/05/2019 postreply 20:50:29

当年的att wireless被自己的软件搞死了,新开发的系统上线没法用。呵呵 -iBear- 给 iBear 发送悄悄话 iBear 的博客首页 (174 bytes) () 04/05/2019 postreply 20:38:53

那是之前。Cingular后来独立了,买了ATT。我为什么知道? -iBear- 给 iBear 发送悄悄话 iBear 的博客首页 (50 bytes) () 04/06/2019 postreply 07:42:32

软件现在也是工程,也要先结构,再分模块,完成组合和测试。如果就是靠某一个工程师来修复乱七八糟的软件,真的是运气。 -HAPPY-DAY- 给 HAPPY-DAY 发送悄悄话 (0 bytes) () 04/05/2019 postreply 20:48:57

你厉害 -每天砍树- 给 每天砍树 发送悄悄话 每天砍树 的博客首页 (0 bytes) () 04/05/2019 postreply 21:10:03

没有,就是舍得比别人多付出。 -VCPP- 给 VCPP 发送悄悄话 VCPP 的博客首页 (0 bytes) () 04/05/2019 postreply 21:39:51

请您先登陆,再发跟帖!