문과생 네버랜드의 데이터 창고

31-1 다중 모수의 최대우도검정 본문

수리통계

31-1 다중 모수의 최대우도검정

K JI 2023. 7. 19. 19:47
  1. 단변량에서 다변량으로 확장
    1) 다중 모수에서의 우도비 검정

    (1) θ=[θ1,θ2,,θn]인 모수 벡터 θ를 정의하자.
    -. 이 때, 특정 모수에 대하여 연구자가 다음의 가설을 내세웠다고 하자.
    [θ1,,θp]라는 θ에 부분집합에 대하여 다음은 참일 것이다
    θ1=ˆθ0/,,/θnp=ˆθp 

    (2) 이와 같이 모수에 대해 어떤 주장을 내세움으로서, 모수 공간 전체에 어떤 영향을 미칠 수 있다.

    -. 다중 모수(중 일부)에 대하여 어떤 가설을 주장하는 것은 전체 모수공간에 대하여 일종의 제약조건으로 작용한다.

    -. 예를 들어, X가 N(μ,σ2)를 따른다고 하자. 이 때, 전체 모수공간은 θΩR2 이다.

    -. 이 때, 연구자가 μ=μ0라고 주장한다고 하자. 그럼 이제 이 공간은 1차원으로 축소된다. 즉 θ0ωR 이다. 즉, 전체 모수공간의 차원을 줄였다.

    (3) 한편, 연구자가 내세운 가설에 대하여 마찬가지로 우도비 검정을 정의해볼 수 있다.

    -. 참모수 θ를 입력받은 우도함수는 가장 높은 우도값을 내뱉는다. 여기에 대하여 우리가 정의한 [ˆθ0/,,/θp=ˆθp]라는 가설의 부분집합을 입력받은 우도함수에 대한 비율을 정의해볼 수 있다.

    -. 참모수 θ를 입력받은 전체 모수공간을 θΩRn, 가설의 부분집합을 입력받은 축소된 부분 모수공간을  θ0ωRnp 라고 정의하자. 그 우도비는 다음과 같이 정의할 수 있다.

    Λ=maxθΩL(θ)maxθΩL(θ) 

    θΩ에 속하는 전체 모수 공간상에서 우도함수는 참모수 [μ,σ2]에서 우도값이 최대화된다.

    여기에 대하여, 연구자가 세운 가설의 공간 θω는 전체 모수공간에 비해 낮은 차원에서
    나름의 우도함수를 갖게 되고, 최대화되는 점도 갖게 된다.

    이 두 점 사이의 거리를 비율로서 정의하고, 가설을 검정하는 것이 다중 모수에서의 최대우도검정이 된다.
    2) 최대우도추정량을 활용한 다중모수에서의 우도비 검정
    (1) 물론, 안타깝게도 우린 참모수가 뭔지 모른다. 다만 확률표본을 이용하여 생성한 통계량 중 으뜸인 최대우도추정량을 활용할 뿐이다.
    -. 최대우도추정량은 전체 모수공간과 축소된 부분 모수공간에 대하여 각각 정의될 필요가 있다.
    위의 예시를 다시 가져오면, 연구자가 주장한 가설을 각각의 제약조건을 두면 다음과 같이 정의할 수 있다.

    전체 모수의 집합 θ=[θ1,θ2,,θn]에 대하여 다음의 가설을 검정한다

    H0:θω VS H1:θΩ 
    이 때, ω는 가설의 제약조건에 따라서 축소된 모수공간을, Ω는 전체 모수공간을 의미한다.

    이 가설을 검정하기 위해, 다음의 우도비 함수를 정의한다
    Λ=maxθΩL(θ)maxθΩL(θ)
    α=maxθΩP[Λc]를 만족하는 임계값 c에 대하여
    Λc이면 H0를 기각하고 H1을 채택

    한편, 다변량 함수에서의 최대우도추정에서 정의한 방법론에 따라, Ωω에 속하는 모수들을
    추정하기 위해 최대우도추정량을 활용한다.

    -. maxθΩL(θ)=L[ˆΩ]
    -. maxθωL(θ)=L[ˆω]

    라고 할 때, 최대우도추정량을 활용한 우도비 검정량은 다음과 같이 정의할 수 있다.
    Λ=L[ˆΩ]L[ˆω]

    3) 다중모수에서의 우도비 검정의 특성
    (1) 카이제곱 분포와의 관계
    -. 단변량때와 마찬가지로 우도비 검정간에는 다음의 관계가 성립된다.
    [X1,Xn]θΩRp에 속하는
    모수 θ를 가진 공통 pdf f(X;θ)를 가지는 분포의 i.i.d라고 하자.

    이 때, 정칙조건을 만족한다고 가정한다.

    ˆθ를 전체 모수공간 Ω에 속하는 우도함수에서 파생된 최대우도추정량이라 하고,
    ˆθ0을 모수공간이 (pq)만큼 축소된 모수공간 ω에 속하는 우도함수에서 파생된 최대우도추정량이라 하자. 단, q는 가설로서 내세운 모수의 갯수이다.

    Λ=L[ˆΩ]L[ˆω] 라고 정의할 때 다음은 참이다.
    2log(λ)Dx2(q)

    즉, λ에 대한 변환 통계량은 가설 갯수 q를 자유도로 갖는 카이제곱 분포로 분포수렴한다.
  2. 예시로 보는 다중모수 최대우도검정
    1) 정규분포 하에서의 최대우도검정
    [X1,,Xn]이 iid N(μ,σ2)이라고 할 때 다음을 검정하고자 한다.
    H0:μ=μ0 VS H1:μμ0
    -. 전체 모수공간 Ω 에서의 L(Ω)를 구하면
    L(Ω)=ni=112πσexp(12(Xiμσ)2)
    모수 각각에 대하여 MLE 추정량을 구하면
    μMLE=1nni=1Xi=¯XσMLE=1n1ni=1(Xi¯X)2=S
    L(Ω)에 대하여 MLE 추정량을 삽입하면
    maxθΩL(θ)=L[ˆΩ]=ni=112πsexp(12(Xi¯Xs)2)=12πn/21(s)n/2exp(n/2)
    한편, 연구자가 주장하는 값 μ0를 넣어 축소된 maxθωL(θ)를 구하면
    μ0,MLE=μ0σ0,MLE=1n1ni=1(Xiμ0,MLE)2
    maxθωL(θ)=L[ˆω]=ni=112πsexp(12(Xiμ0σ0,MLE)2)=12πn/21(σ0,MLE)n/2exp(n/2)
    Λ를 다음과 같이 정의한다.
    Λ=L[ˆΩ]L[ˆω]=12πn/21(s)n/2exp(n/2)12πn/21(σ0,MLE)n/2exp(n/2)=[σ0,MLEs]2/n=[ni=1(Xiμ0)2ni=1(Xi¯X)2]2/n
    2log(λ)Dx2(1)을 이용하여 이제 가설을 검정할 수 있다.
    2) 다항분포 하에서의 최대우도검정
    삼항분포의 pdf를 다음과 같이 정의하자
    f(x1,x2;p1,p2)=px11px22(1p1p2)(nx1x2)
    여기서 추출한 확률표본을 다음과 같이 정의하자.
    [(X11,X21),(X12,X22),,(X1n,X2n)]
    다음의 가설을 검정하고자 한다.
    H0:p1=p2 VS H1:p1p2
    -. 전체 모수공간 Ω에 대하여 L(Ω)를 구하면
    L(Ω)=ni=1px1n1px2n2(1p1p2)(nx1nx2n)
    -. 모수 각각에 대하여 MLE 추정량을 구하면
    p1:ˆp1=ni=1X1nnp2:ˆp2=ni=1X2nn
    L(Ω)에 대하여 MLE 추정량을 삽입하면
    maxθΩL(θ)=L[ˆΩ]=ni=1ˆpx1n1ˆpx2n2(1ˆp1ˆp1)(nx1nx2n)=ˆpni=1x1n1ˆpni=1x2n2(1ˆp1ˆp1)ni=1(nx1nx2n)=ˆpnˆp11ˆpnˆp22(1ˆp1ˆp1)n(1ˆp1ˆp2)
    한편, 연구자가 주장하는 p1=p2를 반영하여 축소된 maxθωL(θ)를 구하면
    p=p1=p2 에서
    L(ω)=ni=1px1npx2n(12p)(nx1nx2n)=pni=1x1npni=1x2n(12p)ni=1(nx1nx2n)
    이 때, T1=ni=1X1n으로, T2=ni=1X2n 으로 정의하자. 
    그럼 
    L(ω)=pT1+T2(12p)n(1T1T2) 이다.
    이 떄, p에 대하여 최대우도추정량을 구하면
    l(ω)p=T1+T2pnT1T212p=0에서 
    ˆp=T1+T22n=ˆp1+ˆp22
    따라서, 이 최대우도추정량을 투입한 축소 모수공간의 최대우도함수는 다음과 같다.
    L(ˆω)=(ˆp1+ˆp22)T1+T2(12(ˆp1+ˆp22)n(1T1T2)=(ˆp1+ˆp2)n(ˆp1+ˆp2)2(1ˆp1+ˆp2)n(1ˆp1+ˆp2)

    이제, 우도비함수를 정의하면
    Λ=L[ˆΩ]L[ˆω]=ˆpˆp11ˆpˆp22(1ˆp1ˆp1)n(1ˆp1ˆp2)(ˆp1+ˆp2)n(ˆp1+ˆp2)2(1ˆp1+ˆp2)n(1ˆp1+ˆp2)=[2ˆp1ˆp1+ˆp2]nˆp1[2ˆp2ˆp1+ˆp2]nˆp2

    2log(λ)Dx2(1)을 이용하여 이제 가설을 검정할 수 있다.
     

 

'수리통계' 카테고리의 다른 글

33. 충분통계량  (1) 2023.07.21
32. EM 알고리즘(with GMM)  (2) 2023.07.20
19-1 다변량 함수에서의 최대우도추정  (0) 2023.07.18
31. 최대우도검정  (0) 2023.07.17
30. 라오-크래머 한계와 효율성  (0) 2023.07.14