통계학 - 베르누이 시행과 분포, 이항분포
1. 베르누이 시행
성공과 실패 중 하나로 나타나는 시행으로 아래와 같은 특징을 가질때 베르누이 시행이라 부른다.
- 각 시행에서는 성공 확률 p=P(S)은 동일해야 한다.
- 각 시행은 서로 독립이어야 한다.
EX) 동전 던지기를 할 때 앞면이 성공, 뒷면이 실패로 정의될 경우
2. 베르누이 분포
베르누이 분포란 단 한번의 베르누이 시행에 대한 분포를 나타내는 것이다. 베르누이 분포는 이산 확률 분포로 확률 질량 함수로 정의된다. 실제 정의 내용은 아래와 같다.
\[f(x)=P(X=x)=Bern(p)=\begin{cases} p & \text{ if } \: x= 1\\ 1-p & \text{ if } \: x= 0 \end{cases}\]여기서 p는 성공 확률이고, (1-p)는 실패 확률이다.
1) 베르누이 분포 특성
a. 기대값
베르누이 분포에서는 성공과 실패 두 가지 경우의 값이 있으므로 성공 확률인 p와 실패 확률인 1-p로 가중 평균을 계산한다.
\[E(X) = 1\cdot p + 0 \cdot (1-p) = p\]b. 분산
제곱의 평균 $1^{2}\cdot p + 0^{2}\cdot(1-p)$ 빼기 평균의 제곱 $p^{2}$으로 표현되며 p가 0.5일 때 최대값을 가지게 된다.
p가 0또는 1에 가까워질 수록 분산은 작아진다.
2. 이항분포
베르누이 시행을 독립적으로 반복하여 결과를 관찰하는 경우에 사용되는 확률분포이다. 이진 결과를 가지는 시행에서 성공 횟수의 확률 분포를 나타내는데 사용되며 확률변수 X는 성공의 횟수로 양의 정수를 갖게 된다.
베르누이 시행을 반복하는 것이기 때문에 베르누이 시행의 조건을 그대로 따른다.
이항 분포의 확률 질량 함수는 다음과 같이 표현된다.
\[f(x) = P(X=x) = B(n,p) = \binom{n}{x}p^{x}(1-p)^{n-x} = \frac{n!}{x!(n-x)!}\cdot p^{x}(1-p)^{n-x}\]- P(X=X)는 x번 성공할 확률이다.
- $\binom{n}{x}$는 이항 계수(binormial conefficient)로, n개의 시행 중에서 x번의 성공이 발생할 수 있는 조합의 수이다.
- p, (1-p), n은 각각 성공확률, 실패확률, 시행 총 횟수이다.
1) 이항 분포 특성
a. 기댓값
\(E(X) = np\)
b. 분산
\(Var(X)=np(1-p)\)
참고자료
This post is licensed under CC BY 4.0 by the author.