Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
Tags
- 미적분
- 프로그래머를 위한 선형대수 #선형대수 #행렬계산
- Media Mix Modeling
- 미적분 #사인과 코사인의 도함수
- 프로그래머를 위한 선형대수 #선형대수 #LU분해
- 프로그래머를 위한 선형대수 #선형대수 #고유값 #고유벡터 #야코비 회전법 #QR법 #하우스홀더반사 #행렬회전
- Marketing Mix Modeling
- 미적분 #평균값 정리 #로피탈의 정리 #접선의 방정식
- 시계열분석 #Time-Series Analysis #이상탐지 #Anomaly Detection #Spectral Residual #CNN #SR-CNN
- bayesian inference
- lightweightmmm
- bayesian
- Optimization
- 미적분 #접선의 방정식 #최적화 #뉴턴법 #뉴턴-랩슨법
- 수리통계
- 프로그래머를 위한 선형대수 #선형대수 #고유분해 #고윳값 #고유벡터
- 프로그래머를 위한 선형대수 #선형대수 #고유값 #고유벡터 #고유분해
- mmm
Archives
- Today
- Total
문과생 네버랜드의 데이터 창고
15-1 다변량 정규분포 본문
-
표준 다변량 정규분포
1) 표준 다변량 정규분포의 pdf
(1) z1,...,zn을 i.i.d이고 N(0,1)을 따르는 확률변수라고 할 때
-. 이 확률표본들의 확률벡터 Z 의 결합확률밀도함수는 i.i.d에서의 조건에 따라 다음과 같이 나타낼 수 있다.fz(Z)=∏ni=11√2πexp(−z22)=(12π)n2exp(−12∑ni=1z2i)
-. 위 식을 벡터형식으로 고쳐서 다시 표현하면 아래와 같이 쓸 수 있다.(12π)n2exp(−12zTz)
2) 평균과 공분산 행렬
(1) 표준 다변량 정규분포의 평균과 분산은 각각 n차원의 벡터와 nxn의 행렬로 나타난다.
평균 E(z) 0 (단, 0는 n차원의 0벡터) 공분산행렬 I=[10...001...0⋮⋱⋱⋮00...1]
대각 이외의 성분 σi,j가 0인 이유는 i.i.d를 가정했기 때문이다.
(2) Z의 MGF는 아래와 같이 구할 수 있다.
각각의 확률표본 z1,...,zn 의 mgf는 fi=exp(t2i2) 와 같고, i.i.d 조건에 따라 mgf의 결합은
Mz(t)=E[exp(t2z)]=E[n∏i=1exp(tizi)]=n∏i=1E[(exp(tizi)]한편, fi=exp(t2i2) 이므로, 이를 반영하여 위 식을 수정하면
n∏i=1E[(exp(tizi)]=n∏i=1[exp(12t2i)]=exp(12n∑i=1t2i)exp(12∑ni=1t2i)를 벡터 형식으로 고치면
exp(12n∑i=1t2i)=exp(12tTt) - 표준 다변량 정규분포에서 정규분포로의 확장
1) 표준 다변량 정규분포의 확률벡터 Z에 대하여 그 공분산 행렬 Σ이 존재한다고 하자.
(1) 공분산 행렬은 양의 반정부호 행렬이므로, 다음과 같이 고유분해가 가능하다.
Σ=ΓTΛΓ
-. 이 때, Λ는 고윳값을 대각성분으로 가지는 행렬이고, Γ는 각 고윳값에 해당하는 고유벡터의 정규직교행렬이다.
(2) 정규직교행렬의 성질에 따라, Γ−1=ΓT와 같고
-. 따라서 ΓT⋅Γ=I 이므로
-. Σ=ΓTΛ12Γ⋅ΓTλ12Γ로 표현 가능하다.
(3) 위에서 파생되어, Σ12는 다음과 같이 표현이 가능하다.
Σ12=ΓTΛ12Γ
(4) 이제, 변환 확률벡터 X를 다음과 같이 정의하자.
X=Σ12Z+μ
-. 위의 경우 다변량 확률벡터의 선형성에 따라 ,
E[X]=Σ12E[Z]|=0+μ=μ이고
Cov(X)=Σ12⋅Cov(Z)⋅Σ12=Σ12Σ12=Σ 이다.
2) 다변량 정규분포의 MGF
(1) 다변량 정규분포 X를 가정하자.
-. 위에서 표준 다변량 정규분포 Z를 이용한 X=Σ12Z+μ를 정의하였으므로, 이를 이용하면E[etx]=E[etT(Σ12Z+μ)]=E[etTΣ12Z+tTμ)]=etTμ⋅E[etTΣ12Z] 이 때, tTΣ12=w로 치환하면, E[ewTz]이고,
표준 다변량 정규분포의 mgf는 exp(12tTt) 이므로
E[ewTz]=12e12wTw=12e12(Σ12t)T(Σ12t)12e12(Σ12t)T(Σ12t) 내부의 전치 (Σ12t)T 를 풀어 내적을 수행하면 아래의 MGF 식을 얻는다.
Mx(t)=exp(tTμ+12tTΣt)
(1) 순서가 거꾸로 뒤집혔지만, 이제 다변량 정규분포의 pdf를 구할 수 있게 되었다.
(2) X=Σ12Z+μ 를 정의했을때, 그 역함수는 Z=(X−μ)⋅Σ12 이고,
-. 따라서 |J| = Σ12 이다.
-. 이를 이용해서 표준 다변량 정규분포의 pdf로부터 다변량 정규분포를 (일반화하여) 유도하면|J|=|Σ|−1/2 는 앞쪽의 상수부로 들어가고,
(X−μ)⋅Σ12는 ZTZ에 대응하여 이차형식으로 넣으면
fx(X)=12πn2|Σ|1/2exp(−12(X−μ)TΣ−1(X−μ)) - 다변량 정규분포의 분할
1) 다변량 정규분포의 선형변환
(1) X가 N(μ,Σ)를 따르는 다변량 정규벡터라고 하자.
-. 상수행렬 A가 (m x n) 행렬이고, b는 임의의 상수 벡터일때 아래의 관계가 성립된다.Y=AX+b 라고 하자. 이 선형변환 결과 도출된 Y는 N(Aμ+b,AΣAT)인 다변량 정규분포를 따른다.
이는 다음과 같이 증명할 수 있다.My(t)=E[exp(tTY)] 라고 하자. 이는 아래와 같이 전개 가능하다.
E[exp(tTY)]=E[exp(tT(AX+b))]
한편, 이 기댓값은 다변량 정규분포 X에만 의존하는 기댓값이므로, 상수항을 밖으로 빼면
E[exp(tT(AX+b))]=exp(tTb)⋅E[exp(ATt)TX)]한편, E[exp(ATt)TX)]는 정규분포의 mgf에서 t→(ATt)로 변환한 것에 불과하므로, 이를 이용하면
exp(tTb)⋅E[exp(ATt)TX)]=exp(tTb)⋅exp[(ATt)Tμ+(1/2)(ATt)TΣ(ATt)]
상수항 exp(tTb)을 다시 집어넣고 정리하면
exp[tT(Aμ+b)+(1/2)tTAΣ(ATt)]
이 mgf는 N(Aμ+b,AΣAT) 를 따르는 분포의 MGF이고, 이로서 증명된다.
2) 다변량 정규분포의 분할
(1) 벡터 X를 m차원의 벡터라고 하자
(2) X_{1}은 n차원의 부분벡터로, x_{2}를 p = (m - n) 차원인 부분 벡터라고 정의할 경우
-. 이 분할을 수행해주는 분할 행렬 A를 다음과 같이 정의할 수 있다.(m =6, n = 4로 정의할 경우)
-. 이 때, X1=AX 으로 표현할 수 있고, 분할된 확률벡터 X1, X2는 다음과 같은 평균벡터와 공분산 벡터를 가진다.
평균벡터 μ=[μ1μ2] 공분산행렬 Σ=[Σ1,1Σ1,2Σ2,1Σ2,2]
'수리통계' 카테고리의 다른 글
17. T분포와 F분포 (0) | 2023.06.22 |
---|---|
16. 혼합분포 (0) | 2023.06.21 |
15. 정규분포 (2) | 2023.06.19 |
14-1. 감마분포의 친족분포들(카이제곱, 베타, 디리클레 분포) (0) | 2023.06.01 |
14. 감마분포 (0) | 2023.05.30 |