PromleeBlog
sitemap
aboutMe

posting thumbnail
일반적인 확률 변수
Normal Random Variable

📅

🚀

누적 분포 함수: CDF (Culmulative Distribution Function, CDF) 🔗

P(X=x)P(X = x) 대신 P(Xx)P(X \leq x)가 필요할 때 사용
예시
확률 변수 XX의 CDF는 FXF_X로 표기되며 P(Xx)P(X \leq x)의 확률을 제공한다.
FX(x)=P(Xx)={kxpX(k)X가 이산형일 때xfX(t)dtX가 연속형일 때F_X(x) = P(X \leq x) = \begin{cases} \sum_{k \leq x} p_X(k) & X \text{가 이산형일 때} \\ \int_{-\infty}^{x} f_X(t) dt & X \text{가 연속형일 때}\\ \end{cases}

🚀

이산 확률 변수의 CDF (Discrete Random Variable: CDF) 🔗

XX가 이산형일 때, FX(x)F_X(x)xx의 구간마다 일정한 값을 가지는 함수
FX(x)=P(Xx)=kxpX(k)F_X(x) = P(X \leq x) = \sum_{k \leq x} p_X(k)

🚀

연속 확률 변수의 CDF (Continuous Random Variable: CDF) 🔗

XX가 연속형일 때, FX(x)F_X(x)xx의 연속 함수
FX(x)=P(Xx)=xfX(t)dtF_X(x) = P(X \leq x) = \int_{-\infty}^{x} f_X(t) dt
CDF는 단조 증가(monotonically increasing)하다
FX(k)F_X(k)kk \to -\infty일 때 0, kk \to \infty일 때 1에 수렴한다.

예제 (구간별 상수 확률 밀도 함수) 🔗

➡️

문제 🔗

알빈의 출근 시간은 15분에서 20분 사이일 확률이 2/3이고, 20분에서 25분 사이일 확률이 1/3이다. 각각의 시간은 동일한 확률로 발생한다. PDF를 작성할 수 있는가?
CDF는 어떻게 되는가?
➡️

해결 🔗

PDF
P(15X<20)=2/3=5pp=2/15P(15 \leq X < 20) = 2/3 = 5p \Rightarrow p = 2/15
P(20X<25)=1/3=5pp=1/15P(20 \leq X < 25) = 1/3 = 5p \Rightarrow p = 1/15
fX(x)={2/1515x<201/1520x<250otherwisef_X(x) = \begin{cases} 2/15 & 15 \leq x < 20 \\ 1/15 & 20 \leq x < 25 \\ 0 & \text{otherwise} \end{cases}


CDF
- PDF를 적분하여 구할 수 있다.
FX(x)=xfX(t)dt={2/15(x15)15x<201/15(x20)+2/320x<251x25F_X(x) = \int_{-\infty}^{x} f_X(t) dt = \begin{cases} 2/15(x-15) & 15 \leq x < 20 \\ 1/15(x-20) + 2/3 & 20 \leq x < 25 \\ 1 & x \geq 25 \end{cases}

🚀

정규 확률 변수 (Normal Random Variable) 🔗

연속 확률 변수 XX가 다음 형태의 PDF를 가지면 정규 분포 또는 가우시안 분포를 따른다고 한다.
fX(x)=12πσe(xμ)2/2σ2f_X(x) = \frac{1}{\sqrt{2\pi}\sigma} e^{-(x-\mu)^2/2\sigma^2}
평균: E[X] = μ\mu
분산: var(X) = σ2\sigma^2

🚀

정규 확률 변수의 특징 1. 대칭성 (Symmetry of Normal Random Variable) 🔗

정규 확률 변수는 평균 μ\mu를 중심으로 대칭이다.
FX(μ+x)=1FX(μx)F_X(\mu + x) = 1 - F_X(\mu - x)

🚀

정규 확률 변수의 특징 2. 선형 변환 (Linear Transformation of Normal Random Variable) 🔗

XX가 정규 분포를 따르면, Y=aX+bY = aX + b도 정규 분포를 따른다.
평균: E[Y] = aμ+ba\mu + b
분산: var(Y) = a2σ2a^2\sigma^2

🚀

정규 확률 변수의 특징 3. 표준 정규 확률 변수 (Standard Normal Random Variable) 🔗

평균이 0이고 분산이 1인 정규 확률 변수를 표준 정규 확률 변수라고 한다.
표준화
XX가 평균 μ\mu와 분산 σ2\sigma^2를 가진 정규 확률 변수라고 하자. 우리는 XX를 다음과 같이 표준 정규 확률 변수 YY로 표준화한다.
Y=XμσY = \frac{X - \mu}{\sigma}

증명 (표준 정규 확률 변수) 🔗

정규 확률 변수 XX가 주어졌을 때,
표준화를 통해,
증명: YYXX의 선형 변환이기 때문에, YY는 정규 분포를 따른다. 더불어,
따라서, YY는 표준 정규 확률 변수다.

🚀

표준 정규 확률 변수의 CDF (CDF of Standard Normal Random Variable) 🔗

표준 정규 확률 변수 YY의 CDF는 Φ(y)\Phi(y)로 표기한다.
YY가 표준 정규 확률 변수일 때, YY의 CDF는 다음과 같다.
Φ(y)=P(Yy)=12πyet2/2dt\Phi(y) = P(Y \leq y) = \frac{1}{\sqrt{2\pi}}\int_{-\infty}^{y} e^{-t^2/2} dt

예시 (표준 정규 분포표) 🔗

.00.01.02.03.04...
0.00.50000.50400.50800.51200.5160...
0.1
0.5398
0.54380.54780.55170.5557...
0.20.5793
0.5832
0.58710.59100.5948...
0.30.61790.62170.62550.62930.6331...
.....................

예제 (표준 정규 확률 변수의 CDF) 🔗

➡️

문제 🔗

특정 지역의 연간 강설량은 평균 μ=60\mu = 60 인치, 표준 편차 σ=20\sigma = 20인 정규 확률 변수로 모델링된다. 올해의 강설량이 최소 80인치일 확률은 얼마인가?
➡️

해결 🔗

표준화를 통해, 표준 정규 확률 변수 YY를 구한다.
Y=Xμσ=X6020Y = \frac{X - \mu}{\sigma} = \frac{X - 60}{20}
그러면
P(X80)=P(X6020806020)=P(Y1)=1P(Y1)=1Φ(1)P(X \geq 80) = P\left( \frac{X - 60}{20} \geq \frac{80 - 60}{20} \right) = P(Y \geq 1) = 1 - P(Y \leq 1) = 1 - \Phi(1)
1Φ(1)=10.8413=0.15871 - \Phi(1) = 1 - 0.8413 = 0.1587

🚀

요약 (Summary) 🔗

정규 확률 변수
(Normal Random Variable)
연속 확률 변수 XX가 다음 형태의 PDF를 가지면 정규 분포 또는 가우시안 분포를 따른다고 한다.
여기서 μ\muσ2\sigma^2는 각각 평균과 분산으로, PDF를 특징짓는다.

표준화
(Standardization)
XX가 평균 μ\mu와 분산 σ2\sigma^2를 가지는 정규 확률 변수라고 하자. 우리는 XX를 표준 정규 확률 변수 YY로 표준화할 수 있다.

🚀

추가 문제 🔗

➡️

문제 🔗

XX가 평균이 0이고 표준 편차가 σ\sigma인 정규 확률 변수라고 하자.
표준 정규 분포표를 사용하여 다음 사건의 확률을 계산하라:
{Xkσ}\{ X \geq k\sigma \}{Xkσ}\{ |X| \leq k\sigma \} for k=1,2,3k = 1, 2, 3
image
➡️

해결 🔗

ZZ를 표준 정규 확률 변수로 정의하자.


P(Xkσ)=P(Zk)=1P(Zk)=1Φ(k)P(X \geq k\sigma) = P\left( Z \geq k \right) = 1 - P(Z \leq k) = 1 - \Phi(k)
표에 의하면, Φ(1)=0.8413,Φ(2)=0.9772,Φ(3)=0.9986\Phi(1) = 0.8413, \quad \Phi(2) = 0.9772, \quad \Phi(3) = 0.9986
P(Xσ)=10.8413=0.1587P(X \geq \sigma) = 1 - 0.8413 = 0.1587
P(X2σ)=10.9772=0.0228P(X \geq 2\sigma) = 1 - 0.9772 = 0.0228
P(X3σ)=10.9986=0.0014P(X \geq 3\sigma) = 1 - 0.9986 = 0.0014


P(Xkσ)=P(kσXkσ)=P(kXσk)=P(kZk)=Φ(k)Φ(k)=Φ(k)(1Φ(k))=2Φ(k)1P(|X| \leq k\sigma) = P(-k\sigma \leq X \leq k\sigma) = P\left( -k \leq \frac{X}{\sigma} \leq k \right) = P\left( -k \leq Z \leq k \right) = \Phi(k) - \Phi(-k) = \Phi(k) - (1 - \Phi(k)) = 2\Phi(k) - 1
P(Xσ)=2Φ(1)1=2(0.8413)1=0.6826P(|X| \leq \sigma) = 2\Phi(1) - 1 = 2(0.8413) - 1 = 0.6826
P(X2σ)=2Φ(2)1=2(0.9772)1=0.9544P(|X| \leq 2\sigma) = 2\Phi(2) - 1 = 2(0.9772) - 1 = 0.9544
P(X3σ)=2Φ(3)1=2(0.9986)1=0.9972P(|X| \leq 3\sigma) = 2\Phi(3) - 1 = 2(0.9986) - 1 = 0.9972