指数分布中的参数λ=1/θ即是泊松过程中的强度

首先来介绍一下从前几天到刚才以来一直困扰我的两个问题:

1.很多所谓的教科书上都喜欢把指数分布这种模型套用在“寿命”问题上,比如电子元件的寿命或者是动物的寿命。那么,当我看过指数分布的密度函数图形时我就疑惑:“假如某一指数分布的参数θ=1/λ即寿命期望为50岁的话,那么是否新生婴儿的死亡概率要比老人的死亡率更大?而电子元件在其使用之前比使用一段时间之后更容易坏?”

2.如何理解指数分布的无记忆性?即如何理解“已知一个元件已经使用了s小时,至少再使用t小时的概率与从一开始就至少使用t小时的概率相等?”这一点又如何在密度函数的图形上面做出合理的解释(就如易解释出正态分布一样)?另外,何为指数分布是“永远年轻”的?

显然,我当时对第一个问题的理解是错误的,是初学者的幼稚行为。而我也将会从解决第二个问题开始,将思路一直延伸下去来纠正第一种想法的错误。

其实我最初想找的感觉就是利用几何分布的无记忆性来理解指数分布的无记忆性,事实上证明这种思路是完全可行的。其实几何分布就是在已经试验n次尚未成功的条件下,再试k次仍然未成功的概率与重新开始试k次未成功的概率相等,而与n无关。举两个例子:

1.定点投篮训练(无技术指导,无体力消耗,无心理因素影响),只要投中就结束训练,否则要一次一次继续投下去。易理解这也是一种等待分布,只不过随机变量是离散型的。显然,n次投不中后,再投k次依旧不中与从一开始就k次不中的概率完全一样。不会由于前n次投不中就会增加或减少后面投篮的命中率,此即为无记忆性。

2.在x把钥匙当中找出一把开一扇门,每次找正确的概率是1/x(不对找错的钥匙进行记忆)。那么,n次找不到之后,再找k次也找不到的概率与从一开始找了k就找不到的概率相等,此亦即无记忆性。

那么以此为基础,再来理解连续型随机变量的无记忆性就较为容易了。仍是以寿命问题作为模型,参见“用二项分布的近似来理解泊松分布”一节(事实上指数分布中的参数λ=1/θ即是泊松过程中的强度),我仍旧将强度λ作为“催命系数”来比喻,那么当活着的每时每刻其实都受到来自“死亡”的催促。可以想象,如果能将时间拆分成为离散型随机变量的话,那么此时的“死”或“生”就能满足n重伯努里试验,离散时间中的之前到此时的“仍旧活着”,与从一开始就“活了那么多个离散时间”的概率是完全一样的。

那么,若再将n趋于+∞,即再将离散的时间连续化,就不难得出指数分布无记忆性的理解方式了:一个身患了艾滋病的病人时时刻刻都受着死亡的威胁,随时都有死亡的可能性。但是在他患病以后至少活时间k的概率与他活了时间n后再活时间k的概率是完全一致的。而且正如离散的投篮次数不会由于前n次投不中就会增加或减少后面投篮的命中率一样,此时也不会因为病人活了时间n还没死就会影响到他再继续活下去的可能性大小。故而,不难说出指数分布是“永远年轻”的。

进而,在其密度函数图形上的[0,t]区间内对应的面积除了可以表示“至少活了时间t还没死”的概率还可表示“已经活了时间n,至少再活时间t不死”的概率,两层含义是同一块图形的面积。

当解决了第二个问题,第一个疑问就会显得多么可笑!就如同投篮多次不中后终将会又一个球命中一样,那个艾滋病人也终将会有离开人世的一天。赌博,一直赢下去的可能性是没有的,随着他每时每刻赌命的胜利,换取生命的同时时间也在不停地走过。此时看看指数分布密度函数下降曲线的图形就知道,时间过得越久,他继续活下来,继续赢取胜利的可能性就越小。所以第一个问题中的结论是完全相反的,原因就是此时密度函数值的大小代表的是在x的某一邻域“还没死”的概率,而不是“死”的概率。

http://terrywang830420.bokee.com/tb.b diaryId=12925557

请您先登陆,再发跟帖!