문과생 네버랜드의 데이터 창고

17. T분포와 F분포 본문

수리통계

17. T분포와 F분포

K JI 2023. 6. 22. 20:26
  1. T분포
    1) 표준정규분포와 카이제곱 분포의 결합분포를 T분포라고 한다.
    (1) 모평균과 모표준편차를 알기 어려운 상황에서, 자유도라 불리우는 표본의 갯수에 따라 통계적 성질이 결정된다.
    (2) 자유도를 n로 할 경우 정규분포로 수렴하므로, 정규분포의 근사 분포로서 주로 활용된다.

    2) T분포의 유도
    (1) pdf의 유도
    -. W ~ N(0,1)을 따르는 분포라 하고, V ~ x2(r)을 따르는 분포라 하자. 두 분포는 서로 독립이다.

    -. 이 때, 두 분포는 독립이므로, 독립인 분포의 성질에 따라 pdf의 단순 결합이 가능하다. 즉 
    h(w,v)=[12πexp(w22)][1Γ(r2)2Γ2vr21ev2]

    -. T=wv/r 로 변수변환을 수행하면, U = V라고 할 때  W=tur
    -. 따라서 변환 야코비안 |J|는 아래와 같다.
    |J|=|uvutwvwt|=|100ur|=ur 
    -. 결합 pdf를 다시 정리하면
    g(t,u)=12πΓ(r2)2Γ2ur21exp[u2(1+t2r)]|ur|

    -. 이제, u에 대하여 적분하여 변환된 확률변수 T에 대한 주변 pdf를 구하면 다음과 같다.
    g(t)=012πΓ(r2)2Γ2ur21exp[u2(1+t2r)]|ur|du

    이 때, z=u2[1+t2r] 라고 하면 |J|=21+t2r2이고, 다시 정리하면

    012πrΓ(r2)2Γ2(2z1+t2r)r+121exp[z]|21+t2r2|dz

    =1πrΓ(r2)2Γ2(1+t2r)r+120zr+121exp[z]dz

    이 때, 적분식 안은 Γ(r+12)와 동일하므로, 이를 반영하여 정리하면

    =Γ(r+12)πrΓ(r2)2Γ2(1+t2r)r+12
    (단, t는 -<t<)
    이것이 바로  T=wv/r의 pdf이다.

    (2) T분포의 평균과 분산
    -. 다시, W ~ N(0,1)을 따르는 분포라 하고, V ~ x2(r)을 따르는 분포라 하자. 두 분포는 서로 독립이다.
    -. T=wv/r 라고 할 때 이 분포의 평균과 분산을 구하면 다음과 같다.

    일반식 E(Tk)=E[wk(vr)k2]=E[wk]E[(vr)k2]

    이 때, 카이제곱의 기타 성질E(xk)의 성질에 따라 

    E(Tk)=E(wk)2kΓ(r2k2)Γ(r2)rk2

    평균 E(T)=E(w)212Γ(r212)Γ(12)r12

    이 때, E(w)=0 이므로 평균은 결국 0이다.
    분산 E(T2)=E(w2)2Γ(r222)Γ(22)r22=E(w2)rr2

    이 때, 표준정규분포 W의  E(w2)=1 이므로

    Var(T)=E(T2)E(T)2=rr2
  2. F분포
    1) 자유도 r1r2를 따르는 서로 독립인 x2 분포에서 파생된 결합분포
    (1) F분포는 분산분석(ANOVA) 등 다양한 통계적 추론 분야에서 활용된다.

    2) F분포의 유도

    (1) U ~ x2(r1) 이고, V~x2(r2) 라고 하자. 두 분포는 서로 독립이다.
    -. 이 때, 두 분포는 독립이므로, 독립인 분포의 성질에 따라 pdf의 단순 결합이 가능하다. 즉 
    h(u,v)=1Γ(r12)Γ(r22)2r1+r22Ur121Vr221exp((U+V)2)

    -. 이 때, W=u/r1v/r2, Z=V 라고 변수변환을 수행하면, 역함수는U=r1zwr2
    그 야코비 |J|는
    |J|=|ZVZWUVUW|=|100r1r2z|=r1r2z

    -. 결합 pdf를 다시 정리하면
    g(w,z)=r1/rr1/22Γ(r12)Γ(r22)2r1+r22wr221zr1+r221exp[z2(r1wr2+1)]

    -. 이제, z에 대하여 적분하여 W에 대한 주변 pdf를 구하면 다음과 같다.
    g(w)=0r1/rr1/22Γ(r12)Γ(r22)2r1+r22wr221zr1+r221exp[z2(r1wr2+1)]dz

    이때, Y=z2(r1wr2+1) 로 변수변환하면 그 야코비안 |J|=2r1w/r2+1 이고, 
    g(w)=0r1/rr1/22Γ(r12)Γ(r22)2r1+r22wr221(2yr1w/r2+1)r1+r221exp[y]|2r1w/r2+1|dy


    적분식 안은 Γ(r1+r22) 과 동일하므로, 정리하면
    Γ(r1+r22)(r1/r2)r1/2Γ(r1/2Γ(r2/2)wr1/21(1+r1w/r2)(r1+r2)/2

    이것이 F분포 W=u/r1v/r2의 pdf이다.
    (2) F분포의 평균과 분산
    -. 다시, U ~ x2(r1) 이고, V~x2(r2) 라고 하자. 두 분포는 서로 독립이다.
    -.  F=u/r1v/r2 라고 할 때 이 분포의 평균과 분산을 구하면 다음과 같다.

    일반식 E(Fk)=(r2r1)kE(Uk)E(Vk)

    이 때, 카이제곱의 기타 성질 E(xk)의 성질에 따라 

    E(Fk)=(r2r1)2kΓ(r2+k)Γ(r2)2kΓ(r2k)Γ(r2)
    평균 E(F)=(r2r1)E(U)21Γ(r21)Γ(r2)이 때, 카이제곱 분포의 기댓값 E(U)=r1 이므로 

    E(F)=(r2r1)r121Γ(r21)Γ(r2)=r2r22
    분산 https://proofwiki.org/wiki/Variance_of_F-Distribution 참조

    분산은 다음과 같다.

    Var(x)=2r22(r2+r12)r1(r24)(r22)2

'수리통계' 카테고리의 다른 글

18. 확률표본과 모수, 그리고 통계량  (0) 2023.06.26
17-1 스튜던트의 정리  (0) 2023.06.23
16. 혼합분포  (0) 2023.06.21
15-1 다변량 정규분포  (0) 2023.06.20
15. 정규분포  (2) 2023.06.19