理學統計學,溫故統計學

 2023-11-18 阅读 15 评论 0

摘要:0、準備 0.1 隨機變量和的方差 D(X+Y)====E(X+Y)2?[E(X+Y)]2D(X)+D(Y)+2E(XY)?2E(X)E(Y)D(X)+D(Y)+2E{(X?E(X))(Y?E(Y))}D(X)+D(Y)+2cov(X,Y) \begin{split} D(X+Y)=&E(X+Y)^2-[E(X+Y)]^2\\ =&D(X)+D(Y)+2E(XY)-2E(X)E(Y

0、準備

0.1 隨機變量和的方差

D(X+Y)====E(X+Y)2?[E(X+Y)]2D(X)+D(Y)+2E(XY)?2E(X)E(Y)D(X)+D(Y)+2E{(X?E(X))(Y?E(Y))}D(X)+D(Y)+2cov(X,Y)

XY彼此獨立時,
D(X+Y)=D(X)+D(Y)

也即:
D(k=1nXk)=k=1nD(Xk)D(1nk=1nXk)=1n2k=1nD(Xk)

0.2 切比雪夫不等式

切比雪夫不等式考察的是單個隨機變量的情況。

設隨機變量 X 具有數學期望 E(X)=μ,方差為 D(X)=σ2,則對于任意正數?>0,不等式:

P{|X?μ|?}σ2?2

或者
P{|X?μ|<?}1?σ2?2

成立。

理學統計學?我們以連續型隨機變量對之進行證明:

P{|X?μ|?}==|x?μ|?f(x)dx|x?μ|?|x?μ|2?2f(x)dx1?2?(x?μ)2f(x)dxσ2?2

根據單隨機變量的切比雪夫不等式,我們可獲得關于方差的一個重要性質:

D(X)=0 的充要條件是 X以概率1取常數 E(X)即:

P{X=E(X)}=1

0.3 n重伯努利分布的均值和方差

設隨機變量Xb(n,p),求 E(X),D(X)
由二項分布的定義可知,隨機變量 Xn重伯努利分布試驗中事件A發生的次數,且在每次試驗中 A 發生的概率為 p引入隨機變量

Xk={1,0,Ak,Ak

易知:
X=X1+X2+?+Xn

由于 Xk 只依賴于第 k次試驗,而各次試驗相互獨立,于是X1,X2?,Xn相互獨立,又知 Xk,k=1,2,?,n服從0-10?1分布,
E(X)=E(\sum_{k=1}^nX_k)=\sum_{k=1}^nE(X_k)=np\\ D(X)=D(\sum_{k=1}^nX_k)=\sum_{k=1}^nD(X_k)=np(1-p)
E(X)=E(k=1nXk)=k=1nE(Xk)=npD(X)=D(k=1nXk)=k=1nD(Xk)=np(1?p)

統計學研究,

0.4 均勻分布的E(X)與D(X)

首先連續型隨機變量的:
\begin{split} &E(X)=\int_{-\infty}^\infty xf(x)dx\\ &D(X)=\int_{-\infty}^\infty (x-E(x))^2f(x)dx \end{split}

E(X)=?xf(x)dxD(X)=?(x?E(x))2f(x)dx

設隨機變量X\sim U(a, b)XU(a,b)
\begin{split} E(x)=&\frac{a+b}2\\ D(x)=&E(X^2)-(E(x))^2\\ =&\frac{(b-a)^2}{12} \end{split}

E(x)=D(x)==a+b2E(X2)?(E(x))2(b?a)212

一、The Law of Larger Numbers(大數定律)

常見的大數定理又有兩種形式:辛欽大數定律(弱大數定理)以及它的一個重要推論伯努利大數定理。

1.1 辛欽大數定理

統計學界的大牛,設 X_1,X_2,\cdots,X_nX1,X2,?,Xn 是相互獨立,服從同一分布的隨機變量序列(i.i.d, independent identically distributed),具有數學期望 E(X_k)=\muE(Xk)=μk=1,2,\cdots,nk=1,2,?,n). 作前 nn 個變量的算術平均 1nk=1nXk,對于任意 ?<0(無窮小量),有:

limnP{|1nk=1nXk?μ|<?}=1

我們只在隨機變量的方差為 D(Xk)=σ2k=1,2,?,n)存在,這一條件下證明上述結果,因為

E(1nk=1nXk)=1nk=1nE(Xk)=1n(nμ)=μ

極簡統計學?又根據獨立性得(D(X+Y)=D(X)+D(Y)+2cov(x,y)):

D(1nk=1nXk)=1n2k=1nD(Xk)=1n2(nσ2)=σ2n

1nk=1nXk 看做一個新的隨機變量(也即單隨機變量),再根據前述的切比雪夫不等式,得:

P{|1nk=1nXk?μ|?}1?σ2/n?2

n大數定理自然成立。

統計學魏宗舒,當然很快數學家們發明了更簡潔的記號和表達描述大數定理:序列 1nk=1nXk以概率收斂于 μ,記做 Xˉ?Pμ

1.2 伯努利大數定理

fAnn 次獨立重復試驗中事件AA發生的次數,PP是事件AA在每次試驗中發生的概率,則對任意正數\epsilon>0?>0,有:
\lim_{n\to\infty}P\{|\frac{f_A}{n}-p|<\epsilon\}=1

limnP{|fAn?p|<?}=1

fAb(n,p),有:

fA=X1+X2+?+Xn

一個通俗的理解是:樣本量足夠大的時候,樣本均值接近于期望值。

二、一個例子

統計學黃良文、假設隨機變量 X等于:拋100次硬幣得到的正面的次數(X is equal to the # of heads after 100 tosses of a fair coin)。

首先我們自然知道該隨機變量的期望值(Expected values):

E(X)==/×100×12=50

大數定律是說,如果樣本量足夠大,樣本均值將趨近于期望值。

Xˉn=1nk=1nXk=55+65+45+?nXˉnμ=50n

楊大成統計學。很多人會誤以為如果100次試驗后,如果正面數高于均值,大數定律會讓后面的正面數更少,這就是所謂的賭徒謬誤(gambler’s fallacy)

事實上,概率并未發生任何改變,大數定律根本不關心前面的有限次試驗,后面還剩下無限次試驗,這無限次的期望值是50.

我們可使用python相關工具箱(scipy)對之進行簡單的仿真模擬:

import scipy.stats as st
import matplotlib.pyplot as pltdef main():n, p = 100, .5X = st.binom(n, p)# X ~ b(n, p)          X_bar = [X.rvs(i+1).mean() for i in range(10000)]plt.figure(facecolor='w', edgecolor='k')plt.plot(range(10000), X_bar, 'g.')plt.axhline(y=50)plt.savefig('./large_number.png')plt.show()if __name__ == '__main__':main()



三、中心極限定理

獨立同分布的中心極限定理

設隨機變量 X1,X2,?,Xn,? 相互獨立,服從同一分布,且具有數學期望和方差:E(Xk)=μ,D(Xk)=σ2,則隨機變量之和 nk=1Xk標準化變量

Yn==k=1nXk?E(k=1nXk)D(k=1nXk)????????k=1nXk?nμnσ2???

程琮醫學統計學?

n 充分大時,有

Yn=k=1nXk?nμnσN(0,1)

四、中心極限定理的應用舉例

生成正態分布隨機數:
n 個獨立同均勻分布 XkU(0,1),則 E(Xk)=12,D(Xk)=112,根據中心極限定理,當 n 比較大的時候,近似有:

Z=k=1nXk?nμnσ2???N(0,1)

為了計算的方便不妨取 n=12×16,此時 nσ2???=4,nμ=96

import numpy as np
import matplotlib.pyplot as plt
import seaborn as snsdef main():N = 10**5X = (np.sum(np.random.rand(N, 192), 1)-96)/4sns.set(style='dark', palette='muted', color_codes=True, font_scale=1.5)plt.figure(figsize=(10, 5))plt.hist(X, 50)plt.show()
if __name__ == '__main__':main()



版权声明:本站所有资料均为网友推荐收集整理而来,仅供学习和研究交流使用。

原文链接:https://hbdhgg.com/2/176615.html

发表评论:

本站为非赢利网站,部分文章来源或改编自互联网及其他公众平台,主要目的在于分享信息,版权归原作者所有,内容仅供读者参考,如有侵权请联系我们删除!

Copyright © 2022 匯編語言學習筆記 Inc. 保留所有权利。

底部版权信息