문과생 네버랜드의 데이터 창고

15-1 다변량 정규분포 본문

수리통계

15-1 다변량 정규분포

K JI 2023. 6. 20. 20:48
  1. 표준 다변량 정규분포
    1) 표준 다변량 정규분포의 pdf
    (1) z1,...,zn을 i.i.d이고 N(0,1)을 따르는 확률변수라고 할 때

    -.  이 확률표본들의 확률벡터 Z 의 결합확률밀도함수는 i.i.d에서의 조건에 따라 다음과 같이 나타낼 수 있다.
    fz(Z)=ni=112πexp(z22)=(12π)n2exp(12ni=1z2i)

    -. 위 식을 벡터형식으로 고쳐서 다시 표현하면 아래와 같이 쓸 수 있다.
    (12π)n2exp(12zTz)

    2) 평균과 공분산 행렬
    (1) 표준 다변량 정규분포의 평균과 분산은 각각 n차원의 벡터와 nxn의 행렬로 나타난다.
    평균 E(z) 0 (단, 0는 n차원의 0벡터)
    공분산행렬 I=[10...001...000...1]

    대각 이외의 성분 σi,j가 0인 이유는 i.i.d를 가정했기 때문이다.

    (2) Z의 MGF는 아래와 같이 구할 수 있다.
    각각의 확률표본 z1,...,zn 의 mgf는 fi=exp(t2i2) 와 같고, i.i.d 조건에 따라 mgf의 결합은 

    Mz(t)=E[exp(t2z)]=E[ni=1exp(tizi)]=ni=1E[(exp(tizi)]
    한편, fi=exp(t2i2) 이므로, 이를 반영하여 위 식을 수정하면

    ni=1E[(exp(tizi)]=ni=1[exp(12t2i)]=exp(12ni=1t2i)
    exp(12ni=1t2i)를 벡터 형식으로 고치면

    exp(12ni=1t2i)=exp(12tTt)
  2. 표준 다변량 정규분포에서 정규분포로의 확장

    1) 표준 다변량 정규분포의 확률벡터 Z에 대하여 그 공분산 행렬 Σ이 존재한다고 하자.

    (1) 공분산 행렬은 양의 반정부호 행렬이므로, 다음과 같이 고유분해가 가능하다. 
    Σ=ΓTΛΓ

    -. 이 때, Λ는 고윳값을 대각성분으로 가지는 행렬이고, Γ는 각 고윳값에 해당하는 고유벡터의 정규직교행렬이다.

    (2) 정규직교행렬의 성질에 따라, Γ1=ΓT와 같고
    -. 따라서 ΓTΓ=I 이므로 

    -. Σ=ΓTΛ12ΓΓTλ12Γ로 표현 가능하다.
    (3) 위에서 파생되어, Σ12는 다음과 같이 표현이 가능하다.
    Σ12=ΓTΛ12Γ

    (4) 이제, 변환 확률벡터 X를 다음과 같이 정의하자.
    X=Σ12Z+μ 
    -. 위의 경우 다변량 확률벡터의 선형성에 따라 ,
    E[X]=Σ12E[Z]|=0+μ=μ이고
    Cov(X)=Σ12Cov(Z)Σ12=Σ12Σ12=Σ 이다.

    2) 다변량 정규분포의 MGF
    (1) 다변량 정규분포 X를 가정하자.
    -. 위에서 표준 다변량 정규분포 Z를 이용한 X=Σ12Z+μ를 정의하였으므로, 이를 이용하면
    E[etx]=E[etT(Σ12Z+μ)]=E[etTΣ12Z+tTμ)]=etTμE[etTΣ12Z]
    이 때, tTΣ12=w로 치환하면, E[ewTz]이고,
    표준 다변량 정규분포의 mgf는 exp(12tTt) 이므로

    E[ewTz]=12e12wTw=12e12(Σ12t)T(Σ12t)
    12e12(Σ12t)T(Σ12t) 내부의 전치 (Σ12t)T 를 풀어 내적을 수행하면 아래의 MGF 식을 얻는다.

    Mx(t)=exp(tTμ+12tTΣt)
    3) 다변량 정규분포의 pdf

    (1) 순서가 거꾸로 뒤집혔지만, 이제 다변량 정규분포의 pdf를 구할 수 있게 되었다.

    (2)  X=Σ12Z+μ 를 정의했을때, 그 역함수는 Z=(Xμ)Σ12 이고,

    -. 따라서 |J| = Σ12 이다.

    -. 이를 이용해서 표준 다변량 정규분포의 pdf로부터 다변량 정규분포를 (일반화하여) 유도하면
    |J|=|Σ|1/2 는 앞쪽의 상수부로 들어가고,
    (Xμ)Σ12ZTZ에 대응하여 이차형식으로 넣으면

    fx(X)=12πn2|Σ|1/2exp(12(Xμ)TΣ1(Xμ))
  3. 다변량 정규분포의 분할
    1) 다변량 정규분포의 선형변환
    (1) X가 N(μ,Σ)를 따르는 다변량 정규벡터라고 하자.
    -. 상수행렬 A가 (m x n) 행렬이고, b는 임의의 상수 벡터일때 아래의 관계가 성립된다.
    Y=AX+b 라고 하자. 이 선형변환 결과 도출된 Y는 N(Aμ+b,AΣAT)인 다변량 정규분포를 따른다.

    이는 다음과 같이 증명할 수 있다.
    My(t)=E[exp(tTY)] 라고 하자. 이는 아래와 같이 전개 가능하다.
    E[exp(tTY)]=E[exp(tT(AX+b))] 
    한편, 이 기댓값은 다변량 정규분포 X에만 의존하는 기댓값이므로, 상수항을 밖으로 빼면
    E[exp(tT(AX+b))]=exp(tTb)E[exp(ATt)TX)]
    한편, E[exp(ATt)TX)]는 정규분포의 mgf에서 t(ATt)로 변환한 것에 불과하므로, 이를 이용하면
    exp(tTb)E[exp(ATt)TX)]=exp(tTb)exp[(ATt)Tμ+(1/2)(ATt)TΣ(ATt)]
    상수항 exp(tTb)을 다시 집어넣고 정리하면
    exp[tT(Aμ+b)+(1/2)tTAΣ(ATt)]

    이 mgf는 N(Aμ+b,AΣAT) 를 따르는 분포의 MGF이고, 이로서 증명된다.

    2) 다변량 정규분포의 분할
    (1) 벡터 X를 m차원의 벡터라고 하자
    (2) X_{1}은 n차원의 부분벡터로, x_{2}를 p = (m - n) 차원인 부분 벡터라고 정의할 경우

    -. 이 분할을 수행해주는 분할 행렬 A를 다음과 같이 정의할 수 있다.(m =6, n = 4로 정의할 경우)


    -. 이 때, X1=AX 으로 표현할 수 있고, 분할된 확률벡터 X1, X2는 다음과 같은 평균벡터와 공분산 벡터를 가진다.
    평균벡터 μ=[μ1μ2]
    공분산행렬 Σ=[Σ1,1Σ1,2Σ2,1Σ2,2]

'수리통계' 카테고리의 다른 글

17. T분포와 F분포  (0) 2023.06.22
16. 혼합분포  (0) 2023.06.21
15. 정규분포  (2) 2023.06.19
14-1. 감마분포의 친족분포들(카이제곱, 베타, 디리클레 분포)  (0) 2023.06.01
14. 감마분포  (0) 2023.05.30