▷ 期望与方差
\[\begin{align*}
\newcommand{\dif}{\mathop{}\!\mathrm{d}}
\newcommand{\p}{\partial}
\end{align*}\]
第四章开始介绍随机变量的数字特征,从随机中找规律
数学期望
数学期望 又称 均值。对于离散型变量,数学期望定义如下:
一维离散型
离散型数学期望
设离散型随机变量 $X$ 的概率分布列为 $P(X=x_i)=p_i$,$i=1,2,\cdots$,若 $\sum_{i=1}^\infty \vert x_i \vert p_i$ 绝对收敛,则称数学期望存在并等于:
\[E[X]=\sum_{i=1}^\infty x_i p_i\\
有时候也写作 E(X)、EX\]
这里我们对绝对收敛作一个解释,对于有限取值的随机变量,数学期望是必然存在的;但对于无穷多项的随机变量,如果不绝对收敛,则交换求和顺序可能会得到不同值,显然不符合数学期望的预期。
二项分布
\[X\sim \mathrm{B}(n,p)\\
\begin{align}
E[X]&=\sum_{k=0}^n k\cdot C_n^k p^k (1-p)^{n-k}\\
&=\sum_{k=1}^n k\frac{n!}{k!(n-k)!} p^k (1-p)^{n-k}\\
&=np\sum_{k=1}^n \frac{(n-1)!}{(k-1)!(n-1-(k-1))!} p^{k-1} (1-p)^{n-1-(k-1))}\\
&=np(p+(1-p))^{n-1}\\
&=np
\end{align}\]
特殊地,
泊松分布
\[X\sim \mathrm{Pois}(\lambda)\\
\begin{aligned}
E[X]&=\sum_{k=0}^{+\infty} k\cdot \frac{\lambda^k e^{-\lambda}}{k!}\\
&=\lambda\sum_{k=0}^{+\infty} \frac{\lambda^{k-1}e^{-\lambda}}{(k-1)!}\\
&=\lambda
\end{aligned}\]
几何分布
\[X\sim G(p) \\
\begin{aligned}
E[X]&= \sum_{k=0}^{+\infty} k p (1-p)^{k-1}\\
&=p\sum_{k=0}^{+\infty} \left[(1-p)^{k}\right]'\\
&=p \left[\sum_{k=0}^{+\infty }q^{k}\right]'(令q=1-p)\\
&=p \left[ \lim_{n\rightarrow \infty} \frac{q(1-q^n)}{1-q} \right]'\\
&=p \left[ \frac{q}{1-q} \right]'\\
&=p \frac{(1-q)+q}{(1-q)^2}\\
&=\frac{1}{p}
\end{aligned}\]
一维连续型
连续型数学期望
如果 $\int_{-\infty}^{\infty} \vert x \vert f_X(x) \dif x$ 收敛,则称 $E[X]=\int_{-\infty}^\infty x f_X(x) \dif x$ 为 $X$ 的数学期望。
均匀分布
\[X\sim \mathrm{U}(a,b)\\
\begin{align}
E[X]&=\int_a^b x\cdot \frac{1}{b-a} \dif x\\
&=\frac{a+b}{2}
\end{align}\]
正态分布
\[X\sim \mathrm{N}(0,1)\\
因为 \varphi(x)=\frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2}} 是偶函数,\\
所以 E[X]=\int_{-\infty}^{+\infty} x\varphi(x) \dif x=0\]
\[X\sim \mathrm{N}(\mu,\sigma^2)\\
E[X]=\mu\]
(一般正态分布的期望可以由期望的线性性推导)
指数分布
\[X\sim\mathrm{Exp}(\lambda),即
f_X(x)=
\begin{cases}
\lambda e^{-\lambda x}, & x\in (0,+\infty)\\
0, &其他
\end{cases}\\
\begin{align}
E[X]&=\int_{-\infty}^{+\infty} xf_X(x) \dif x\\
&= \int_0^{+\infty} x\cdot e^{-\lambda x} \dif (\lambda x)\\
&=-\int_0^{+\infty} x \dif (e^{-\lambda x})\\
&=\left. -xe^{-\lambda x} \right|_0^{+\infty}+\int_0^{+\infty} e^{-\lambda x} \dif x
\end{align}\]
还有另一种求法:
\[\begin{align}
E[X]&=\int_0^{+\infty}x\cdot \lambda e^{-\lambda x}\dif x\\
&=\frac{1}{\lambda}\int_0^{+\infty}\lambda x e^{-\lambda x}\dif (\lambda x)\\
&=\frac{1}{\lambda}\int_0^{+\infty}y e^{-y}\dif y\\
&=\frac{1}{\lambda} \Gamma(2)\\
&=\frac{1}{\lambda}
\end{align}\\
其中,\Gamma(x)=\int_0^{+\infty} y^{x-1} e^{-y} \dif y\]
补充:Gamma函数深入理解,$\Gamma(x)$ 函数是必须要掌握的函数。
二维连续型
二维连续型数学期望
$E[X,Y]=\int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} xy f(x,y)\dif x\dif y$
函数的期望
定理1(离散)
设 $Y=g(X)$,$X$ 的分布律为 $P(X=x_k)=p_k$,若 $\sum_{k=1}^\infty \vert g(x_k) \vert p_k$ 收敛,则:
\[E(Y)=E[g(X)]=\sum_{k=1}^\infty g(x_k) p_k\]
定理1(连续)
设 $Y=g(X)$,$X$ 的概率密度为 $f(x)$,若 $\int_{-\infty}^{+\infty} \vert g(x) \vert f(x) \dif x$ 收敛,则:
\[E(Y)=E(g(X))=\int_{-\infty}^{+\infty} g(x)f(x) \dif x\]
上两条式说明,我们不需要求 $g(X)$ 的分布,只需要知道 $X$ 的分布即可。
定理2(离散)
设 $Z=h(X,Y)$,$(X,Y)$ 的分布律为 $P(X=x_i, Y=y_j)=p_{ij}$,则:
\[E(Z)=E[h(X,Y)]=\sum_{i=1}^{+\infty} \sum_{j=1}^{+\infty} h(x_i,y_j)p_{ij}\]
定理2(连续)
设 $Z=h(X,Y)$,$(X,Y)$ 的概率密度为 $f(x,y)$,则:
\[E(Z)=E(h(X,Y))=\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}h(x,y)f(x,y)\dif x\dif y\]
特别地,$E(X)=\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty} xf(x,y)\dif x \dif y$
数学期望的性质
性质1 常数的期望 $E(c)=c$
性质2 线性性:$E(aX+bY+c)=aE(X)+bE(Y)+c$
性质3 若 $X,Y$ 相互独立,则 $E(XY)=E(X)E(Y)$(反之不成立)
(可以用函数的期望来证明)
例题:设 $X\sim\text{B}(n,p)$,$0< p<1,n\geq1$ 求 $E(X)$
解:我们可以将 $X$ 看作 n重伯努利试验中事件 A 发生的次数,并且每次试验 $P(A)=p$。引入随机变量:
$$
X_k=
\begin{cases}
1 & A发生\\
0 & A不发生
\end{cases}
$$
下标 k 表示第 k 次试验。于是 $X_1,X_2,\cdot,X_n$ 相互独立,服从 (0,1) 分布,且 $X=\sum_{k=1}^n X_k$
故 $E(X)=E(\sum_{k=1}^n X_k)=$$\sum_{k=1}^nE(X_k)=np$
(该例题说明二项分布可以分解为 相互独立 的 (0,1) 分布)
方差
方差
设 $X$ 有有限的数学期望,如果 $E[(X-E[X])^2]<\infty$,则称 $\mathrm{Var}[X]=E[(X-E[X])^2]$ 为 $X$ 的方差,记为 $D(X)$;$\sqrt{\mathrm{Var}[X]}$ 为 $X$ 的标准差,记为 $\sigma[X]$
方差表示随机变量离均值的平均波动。方差越小,说明随机变量比较集中,反之则越分散。方差的定义依赖于数学期望,所以我们可以由数学期望的性质得到方差的性质。
由函数的期望,我们可以得到:
离散型:$D(X)=\sum_{i=1}^{\infty} [x_i-E(X)]^2p_i$
连续型:$D(X)=\int_{-\infty}^{+\infty} [x-E(X)]^2 f(x) \dif x$
由期望的线性性,我们可以得到方差的计算公式:
\[\begin{align}
D(X)&=E \left\{ [X-E(X)]^2 \right\}\\
&=E \left\{ X^2-2XE(X)+[E(X)]^2 \right\}\\
&=E(X^2)-2E(X)E(X)+[E(X)]^2\\
&=E(X^2)-[E(X)]^2
\end{align}\]
上面的公式十分重要!一定要牢记。
离散型
0-1分布
\[E(X)=p\\
E(X^2)=0^2 \cdot(1-p)+1^2 \cdot p=p\\
D(X)=E(X^2)-[E(X)]^2=p(1-p)\]
二项分布
\[X\sim \text{B}(n,p)\\
E(X)=np\\
D(X)=\sum_{k=1}^n D(X_i)=np(1-p)\]
(方差的性质,后面会讲到。)
连续型
泊松分布
\[X\sim \pi(\lambda)\\
P(X=k)=\frac{\lambda^k e^{-k}}{k!}\\
E(X)=\lambda\\
\begin{align}
E(X^2)&=E[X(X-1)+X]=E[X(X-1)]-E(X)\\
&=\sum_{k=0}^{+\infty} k(k-1)\frac{\lambda^k e^{-\lambda}}{k!}+\lambda= \lambda^2\sum_{k=2}^{+\infty} \frac{\lambda^{k-2} e^{-\lambda}}{(k-2)!}+\lambda\\
&=\lambda^2 \sum_{i=0}^{+\infty} \frac{\lambda^i}{i!} e^{-\lambda}+\lambda=\lambda^2+\lambda
\end{align}\\
D(X)=E(X^2)-[E(X)]^2=\lambda\]
均匀分布
\[X\sim \mathrm{U}(a,b)\\
f(X)=
\begin{cases}
\frac{1}{b-a} & a 0 & 其他 \end{cases}\\ E(X)=\frac{a+b}{2}\\ E(X^2)\int_{-\infty}^{+\infty} x^2 f(x)=\int_a^b x^2 \frac{1}{b-a} \dif x=\frac{a^2+b^2+ab}{3}\\ D(X)=E(X^2)-[E(X)]^2=\frac{(b-a)^2}{12}\] 正态分布 \[X\sim \text{N}(\mu,\sigma^2)\\ 令 Z=\frac{X-\mu}{\sigma},E(Z)=0\\ D(Z)=E(Z^2)-0=\int_{-\infty}^{+\infty} t^2 \cdot \frac{1}{\sqrt{2\pi}} e^{-\frac{t^2}{2}} \dif t\\ =-\frac{1}{\sqrt{2\pi}} t e^{-\frac{t^2}{2}} \Big|_{-\infty}^{+\infty}+\int_{-\infty}^{+\infty} \frac{1}{\sqrt{2\pi}} e^{-\frac{t^2}{2}} \dif t =1\\W D(X)=D(\mu+\sigma Z)=\sigma^2 D(Z)=\sigma^2\] 对于 n 个独立的正态分布的线性分布,由期望的线性性,有:$\mu=c_0+c_1\mu_1+\cdots+c_n\mu_n$;由方差的性质:$\sigma=c_1^2\sigma^2+\cdots+c_n^2\sigma_n^2$,也就是说: \[c_0+c_1X_1+\cdots c_nX_n\\ \sim \text{N}(c_0+c_1\mu_1+\cdots+c_n\mu_n, \\c_1^2\sigma^2+\cdots+c_n^2\sigma_n^2)\] 指数分布 \[X\sim \mathrm{E}(a,b)\\ f(x)= \begin{cases} \lambda e^{-\lambda x} & x>0\\ 0 & x\leq0 \end{cases}\\ E(X)=1/\lambda\\ E(X^2)=\int_0^{+\infty} x^2 \lambda e^{-\lambda x}\dif x\\ =-x^2 e^{-\lambda x} \Big|_0^{+\infty}+\int_0^{+\infty} 2x e^{-\lambda x}\dif x=2/\lambda^2\\ D(X)=E(X^2)-[E(X)]^2=2/\lambda^2-1/\lambda^2=1/\lambda^2\] 方差的性质 性质1 设 c 是常数,则 $D(c)=0$ 性质2 $D(cX)=c^2 D(X)$ 性质3 $D(X+Y)=D(X)+D(Y)+2\cdot \text{tail}$,其中,$\text{tail}=E{[X-E(X)][Y-E(Y)]}$,若 $X,Y$ 独立,则有 $D(X+Y)=D(X)+D(Y)$ 综上,若 $X,Y$ 相互独立,则 $D(aX+bY+c)=a^2 D(X)+b^2D(Y)$; 性质4 若 $D(X)=0$,则 $P(X)=c$,且 $X=E(X)$ (以上定理可以由方差的定义和期望的线性性证明) 常见分布的期望与方差总结 详细的推导见前面部分。 名称 记号 分布/密度函数 期望 方差 二项分布 $X\sim B(n,p)$ $P{X=k}=C_n^k p^k (1-p)^{n-k}$ $np$ $np(1-p)$ 泊松分布 $X\sim \pi(\lambda)$ $P{X=k}=\dfrac{\lambda^k}{k!}e^{-\lambda}$ $(\lambda>0)$ $\lambda$ $\lambda$ 几何分布 $X\sim G(p)$ $P(X=k)=p(1-p)^{k-1}$ $\frac{1}{p}$ $\frac{1-p}{p^2}$ 均匀分布 $X\sim U(a,b)$ $f(x)=\dfrac{1}{b-a},a $\dfrac{a+b}{2}$ $\dfrac{(b-a)^2}{12}$ 指数分布 $X\sim E(\lambda)$ $f(x)=\lambda e^{-\lambda x}, x>0$ $\dfrac{1}{\lambda}$ $\dfrac{1}{\lambda^2}$ 正态分布 $X\sim N(\mu,\sigma^2)$ $f(x)=\dfrac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x-\mu)^2}{\sigma^2}}$ $\mu$ $\sigma^2$