概率统计学过去一年了,似乎都忘光了。。。果然还学要复习复习呀。

泊松分布

泊松分布适合于描述单位时间内随机事件发生的次数的概率分布。如某一服务设施在一定时间内受到的服务请求的次数,电话交换机接到呼叫的次数、汽车站台的候客人数、机器出现的故障数、自然灾害发生的次数、DNA序列的变异数、放射性原子核的衰变数等等。

注意到的是泊松分布适合离散型的概率统计,这与正态分布不同。

泊松分布的概率函数为:

P(X=k)=eλλkk!P(X=k)=\frac{e^{-λ}λ^k}{k!}

泊松分布的参数λ是单位时间(或单位面积)内随机事件的平均发生率。

极大似然估计

谈到了泊松分布,不得不想想极大似然估计了。极大似然估计又叫最大似然估计,它用来求一个样本集的相关概率密度函数的参数。对于泊松分布,就是求解λ的近似值。

大体的求解过程:

首先列出对数似然函数:

L(λ)=logi=1nf(kiλ)=i=1nlog(eλλkk!)=nλ+(i=1nki)log(λ)log(i=1nki!)\begin{matrix} L(λ) & = & log \prod_{i=1}^n f(k_i|λ) \\ & = & \sum_{i=1}^n log(\frac{e^{-λ}λ^k}{k!}) \\ & = & -nλ+(\sum_{i=1}^n k_i)log(λ)-log(\sum_{i=1}^n k_i!)\end{matrix}

对函数L取相对于λ的导数并令其等于0:

ddλL(λ)=0n+(i=1nki)1λ=0\frac{d}{dλ}L(λ)=0 \Leftrightarrow -n+(\sum_{i=1}^n k_i)\frac{1}{λ}=0

解得λ从而得到一个驻点:

λMLE=1ni=1nkiλ_{MLE}=\frac{1}{n}\sum_{i=1}^n k_i

参考文献