문과생 네버랜드의 데이터 창고

29-1 다변량 중심극한정리 본문

수리통계

29-1 다변량 중심극한정리

K JI 2023. 7. 13. 18:24
  1. 중심극한정리의 다변량 확장
    1) 단변량에서 중심극한정리를 살펴보았다.
    -. 한편, 단변량 정규분포가 존재하는가 하면, 이를 다변량에 대하여 일반화한 다변량 정규분포 또한 존재하였다.
    -. 마찬가지의 논리로, 단변량 중심극한정리를 다변량에 적용하는것도 가능하다.

    2) 다변량 확장을 위해 알아야 하는 사실들

    (1) L2 Norm
    -. 벡터의 크기를 측정 가능하도록 하는 측도

    -. 벡터 vRn에 대하여 v의 L2 Norm은 다음과 같이 정의할 수 있다. 
    ||v||=ni=1v2i

    -. 이 때, vi는 벡터 v의 1,,n 번째 요소이다

    (2) 다음의 경우는 단변량에서의 정리가 다변량에서도 공통적으로 통용된다.

    -. 확률수렴
    [Xn]이 p차원 확률벡터들의 집합이고, ϵ>0인 임의의 상수인 경 경우 다음은 성립된다.

    limnP[||XnX||ϵ]]=0
    ② 위에 수반되는 따름정리로, 다음 또한 참이다

    [Xn]이 n차원 확률벡터의 집합일 때 다음이 성립되야 확률수렴한다.

    XajPXj
    (단, j=1,,n)


    요소가 각 열별 확률변수 Xj로 수렴되어야 XnpX가 참이다.

    ③ 바로 위에서 수반되는 따름정리로, 다음 또한 참이다.

    [Xn]을 공통인 평균벡터 μ와 공분산행렬 Σ를 갖는 i.i.d인 확률벡터의 집합이라 하자.
    ¯Xn=(Xi)n 를 표본평균들의 벡터라 하자.

    이 떄, 
    ¯XajPμj
    일때 한해 다음이 성립된다.
    XnpX

    -. 분포수렴
    [Xn]이 n차원 확률벡터들의 집합이고, 각자 모두 다변량 CDF Fn(X)를 가진다고 하자. 

    점 X가 CDF F(X)에서 연속인 모든 점이라고 할 때 다음의 상황이 참이라고 하자
    limnFn(X)=F(X)
    그런 경우, [Xn]DX는 참이다.

    -. 분포수렴의 MGF 방법
    [Xn]이 각각 CDF Fn(X)과 적률생성함수 Mn(t)를 갖는 확률벡터 Xn들의 집합이라 하자

    또, 어떤 확률변수 X가 CDF F(X)와 그 적률생성함수 M(t)를 갖는다고 하자.

    임의의 벡터 t에 대하여, h>0인 어떤 임의의 상수에 대해 ||t||<h인 모든 t에 대하여

    limnMn(t)=M(t)
    가 성립하면 
    [Xn]DX
    는 참이다.
  2. 다변량 중심극한정리
    1) 다변량 중심극한정리의 증명
    [Xn]을 공통 평균벡터 μ와 양의 정부호 분산-공분산 행렬을 갖는
    (분포 모양이 정해지지 않은) i.i.d인 확률벡터의 집합이라고 하자.

    다음의 다변량 통계량을 정의하자

    Yn=1nni=1(Xiμ)=n(¯Xμ)

    tRp를 0 근처에서 정의된 요소를 갖는 임의의 벡터라고 하자. 
    통계량 Yn의 다변량 적률생성함수는 다음과 같이 구할 수 있다.

    Mn(t)=E[exp{tT1nni=1(Xiμ})]=E[exp{1nni=1tT(Xiμ})]

    Wi=tT(Xiμ)로 변수변환을 수행하면
    =E[exp{1nni=1tTWi})]

    이 때, W=[t(X1μ)t(X2μ)...t(Xnμ)] 이고,

    확률벡터 W의 변환을 아래와 같이 정의하자. 
    1nW=[t(X1μ)nt(X2μ)n...t(Xnμ)n] 

    이 변환된 확률벡터의 각 요소는 각각 중심극한정리에 의해 다음의 요소로 분포수렴한다.

    [t(X1μ)nt(X2μ)n...t(Xnμ)n]D[N(0,tTΣt)N(0,tTΣt)...N(0,tTΣt)]DN(0,tTΣt)

    한편, 식 ①은 ②의 변환 분포 1nW의 MGF이기도 하다.
    즉, 다시 말해 다음의 극한이 성립해야한다는 의미이다.

    limnMn(t)=limnE[exp{1nni=1tTWi})]exp(tTΣt2)

    이는 Np(0,Σ)다변량 정규분포의 mgf이므로, 이로서
    YnDN(0,Σ)를 증명했다.

'수리통계' 카테고리의 다른 글

31. 최대우도검정  (0) 2023.07.17
30. 라오-크래머 한계와 효율성  (0) 2023.07.14
29. 중심극한정리  (2) 2023.07.12
28. 분포수렴  (1) 2023.07.11
27. 확률 수렴  (2) 2023.07.10