泊松建模的有关理论基础说明
最近在对泊松概率指标进行优化,其间尝试了很多方法,现在将其中的一些思想总结如下,希望能够抛砖引玉,有更多的人提供好的思路和方法,帮助我们将模型完善。
第一篇 序
很多文章研究表明每场比赛中球队的进球数符合Poisson分布, Poisson分布是一种离散型分布,简单来说就是球队在一场比赛中可能的进球数是有限的而不是无限的。其函数形式为:
其中k=0,1,2...n,e为自然对数的底,约等于2.71828,λ为总体均数,k为事件发生的发生数(阳性数)。
这里P(goal=k)表示本场比赛进k个球的概率,这样看来如果我们要计算某球队下一场比赛能进两个球的概率P(goal=2)的话,还需要确定一个变量的值,那就是λ。
通常λ 值被认为是当前球队的攻击实力,实际上我们无法精确计算一只球队的攻击实力,因此最为简单的方法就是采用球队的平均进球数作为λ的值。当然为了更为精确的计算λ值,我们还需要考虑如下几方面的问题:
l 时间衰减
l 移动加权平均
l 历史交锋对手的实力水平及联赛实力水平
l 下一场比赛的对手实力水平及联赛实力水平
l 其他
第二篇 时间衰减
所谓时间衰减,也就是说越是最近的比赛对下一场比赛的影响越大,反之越小。这里我的思路的参考原子核的衰变过程,定义时间衰减的基本方程为:
其中u为衰减系数,λ为此场比赛距本场比赛(即当前将要开赛的比赛)的距离,e为自然对数的底,约等于2.71828,k为条件系数,可以控制衰减的速度。如下图所示。
时间衰减参数k=0.25
时间衰减参数k=1
时间衰减参数k=4
因此,计算平均进球数的过程就变为,先获取球队最近的n场比赛,判断这场比赛距今天比赛的距离,代入时间衰减公式得出u,此时平均进球数的计算公式就变为:
其中g为球队在那一场比赛中的进球数。
关于时间衰减的问题就讲到这里,下一篇将讨论移动加权平均。