Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
Tags
- Media Mix Modeling
- 프로그래머를 위한 선형대수 #선형대수 #고유값 #고유벡터 #고유분해
- 프로그래머를 위한 선형대수 #선형대수 #고유분해 #고윳값 #고유벡터
- 시계열분석 #Time-Series Analysis #이상탐지 #Anomaly Detection #Spectral Residual #CNN #SR-CNN
- lightweightmmm
- 미적분 #평균값 정리 #로피탈의 정리 #접선의 방정식
- 미적분
- 프로그래머를 위한 선형대수 #선형대수 #LU분해
- 프로그래머를 위한 선형대수 #선형대수 #고유값 #고유벡터 #야코비 회전법 #QR법 #하우스홀더반사 #행렬회전
- 미적분 #접선의 방정식 #최적화 #뉴턴법 #뉴턴-랩슨법
- Marketing Mix Modeling
- 프로그래머를 위한 선형대수 #선형대수 #행렬계산
- 수리통계
- mmm
- Optimization
- bayesian
- 미적분 #사인과 코사인의 도함수
- bayesian inference
Archives
- Today
- Total
문과생 네버랜드의 데이터 창고
39. 통계학적 2차형식(Quadratic Form) 본문
-
2차형식이란?
1) 수학에서 2차형식이란 항이 모두 2차인 동차 다항식을 의미한다.
(1) 예를 들면 아래와 같은 경우이다.
4x2+2xy−3y2
-. 위 다항식의 경우, 변수 x와 y에 대하여 2차 형식이다.
2) 구체적으로는, 이차형식은 아래와 같은 형태로 나타낼 수 있는 형태를 의미한다.
(1) 선형결합 형식으로 나타낼 때-. qA(x1,…xn)=∑ni=1∑nj=1aijxixj
(2) 행렬 형식으로 나타낼 때-. qA(x1,…,xn)=xTAx
-. A=PTΛP에서 행렬 Λ의 대각성분(=고윳값 성분)의 형태에 따라 연산의 성질이 달라진다.
-. 특히, 고윳값이 모두 0 초과의 양수인 경우 양의 정부호 행렬이라 칭하며 통계학적으로 중요하게 다뤄진다. - 통계학에서의 2차형식
1) 분산-공분산 행렬
(1) 분산-공분산 행렬은 대표적인 2차형식으로 해석할 수 있다.
-. 선형결합 형식으로 나타낼 경우
n∑i=1(xi−¯x)2=n∑i=1(xi−∑nj=1xjn)2=n∑i=1(x2i+2¯xxi+¯x2)=n∑i=1x2i−2n∑i=1n∑j=1xjnxi+nn∑i=1∑nj=1x2jn2=n−1nn∑i=1x2i+2nn∑i=1n∑j=1xixj
모든 항이 2차인 동차 다항식이기 때문에, 정의에 따라 이는 2차형식이 된다.
-. 행렬형식으로 나타낼 경우
X=[xi−μ] 라는 벡터에 대하여 분산-공분산 행렬은
Σ=XTIX로 나타낼 수 있다.
따라서 이는 2차형식이다.
2) 정규분포의 2차형식 확률변수의 선형결합
(1) 정규분포의 2차 형식인 확률변수들의 선형결합은 카이제곱분포의 가법성을 따른다.
[Xi,…,Xn]을 N(μi,σ2)를 각각 따르는 서로 독립인 확률변수라고 하자.
Qi를 다음의 실2차형태라고 정의하자.
Qi=XTiIXi,(i=1,…,n)
이 2차형태의 선형결합을 다음과 같이 정의하자
Q=Q1+Q2+⋯+Qk−1+Qk
이 때, 다음은 참이다.
① Qσ2∼X2(r) 이다.
Qkσ2는 rk=r−(r1+⋯+rk−1)에 대하여
② Qkσ2∼X2(rk) 이다
3) F분포의 도출
(1) 2차 형식의 정의를 가져와서 F분포를 도출하는데 활용할 수 있다.어떤 실현값들의 행렬을 다음과 같이 정의하자.
A=[X11X12…X1n⋮⋱⋱⋮]
이 때, 각 실현값이 따르는 확률변수 Xij는 서로 독립인 확률변수들이다.
-. 열 차원의 도출
이 때, 이 데이터 행렬의 열의 평균벡터를 정의하면 다음과 같이 나타낼 수 있다.
¯xcn=[¯x.1¯x.2⋮¯x.b]=[x11+x21+⋯+xa1ax12+x22+⋯+xa2a⋮x1b+x2b+⋯+xaba]=[∑ai=1xi1a∑ai=1xi2a∑ai=1xiba]
이 때, 크기 n=ab인 확률표본의 분산 S2은 다음과 같이 정리할 수 있다.
S2=∑ai=1∑bj=1(xij−¯x)2ab−1
분모를 좌변으로 이항하면
(ab−1)S2=a∑i=1b∑j=1(xij−¯x)2
(xij−¯x)2=[(xij−¯xi)+(¯xi−¯x)]2으로 분리하면
a∑i=1b∑j=1[(xij−¯xi)+(¯xi−¯x)]2=a∑i=1b∑j=1[(xij−¯xi)2+a∑i=1b∑j=1(¯xi−¯x)]2+2a∑i=1b∑j=1(xij−¯xi)(¯xi−¯x)
이 때, 각 항별로 각각 정리하면
① ∑ai=1∑bj=1(xij−¯xi)(¯xi−¯x)=∑ai=1[(¯xi−¯x)∑bj=1(xij−¯xi)] 에서, ∑bj=1(xij−¯xi)=0 이므로 이 항은 소거된다.
② ∑ai=1∑bj=1(¯xi−¯x)2=b∑ai=1(¯xi−¯x)2
위 정리 결과를 하나로 합치면
(ab−1)S2=∑ai=1∑bj=1(xij−¯xi)+b∑ai=1(¯xi−¯x)2
이를 2차형식으로 나타내자. 즉
Q=Q1+Q2
이제, 여기에 대하여 각각의 항을 σ2으로 나누자. 즉
Qσ2=Q1σ2+Q2σ2
이 때,
① Qσ2는 (ab−1)S2σ2인데,
이는 스튜턴트의 정리에 따르면 X2(ab−1)의 카이제곱 분포를 따른다.
② Q1σ2는 ∑ai=1[∑bj=1(xij−¯xi)2σ2] 는 X2(b−1)의 a개의 선형결합과 같다.
따라서, 카이제곱 분포의 가법성에 따라 ∑ai=1X2(b−1)∼X2(a(b−1))
위에서 정의한 <정규분포의 2차형식 확률변수의 선형결합>에 따라 Q2는 r2=r−r1이므로
Q2∼X2(ab−1−a(b−1)=a−1) 이다.
-. 행차원의 도출
위 전개와 마찬가지로, 행 평균벡터를 다음과 같이 정의한다.
¯xcr=[¯x1.¯x2.⋮¯xa.]=[x11+x12+⋯+x1bbx21+x22+⋯+x2bb⋮xa1+xa2+⋯+xabb]=[∑bi=1x1ib∑bi=1x2ib…∑bi=1xaib]
열차원에서의 논의를 그대로 따라가서 다음을 도출했다 하자
(ba−1)S2=∑ai=1∑bj=1(xij−¯xj)+a∑bj=1(¯xj−¯x)2
이를 2차형식으로 나타내자. 즉
Q=Q3+Q4
마찬가지로 Q는 X2(ba−1)을 따르고
Q3∼X2(b(a−1))
Q4∼X2(ba−1−b(a−1)=b−1) 이다.
-. 2차형식의 결합
전체평균에 대하여 카이제곱 분포꼴로 표현하면
¯x=X11+X12+⋯+Xabab=∑ai=1∑bj=1xijab
한편, (ab−1)S2을 구할 때 반복적으로 도출되었던 (Xij−¯X)를 각각 행평균과 열평균인 ¯xnr, ¯xcn, 그리고 전체평균 ¯x로 나타내면
(Xij−¯X)=(¯Xnr−¯X)+(¯Xcn−¯X)+(Xij−¯Xnr−¯Xcn+¯X)
따라서
(ab−1)S2=ba∑i=1(¯Xi.−¯X)2+ab∑j=1(¯X.j−¯X)2+a∑i=1b∑j=1(Xij−¯Xi.−¯X.j+¯X)2
이를 이차형식으로 표현하면
Q=Q2+Q4+Q5
이 때, Q∼X2(ab−1), Q2∼X2(a−1)이고, Q4∼X2(b−1) 이므로
Q5∼X2(ab−1−a+1−b+1=(a−1)(b−1))을 따른다.
한편, Xij는 모두 독립임을 가정하였으므로, 그 2차형식도 마찬가지로 서로 독립이다.
다음과 같은 비율을 정리하자
Q4Q3=Q4/σ2(b−1)Q3/σ2(a−1)∼F(b−1,b(a−1))
Q4Q5=Q4/σ2(b−1)Q3/σ2((a−1)(b−1))∼F(b−1,(a−1)(b−1))
은 각각의 자유도를 가지는 F-분포를 따른다.
'수리통계' 카테고리의 다른 글
39-1. 비중심 카이스퀘어 분포와 F분포 (0) | 2023.07.31 |
---|---|
40. 일원배치 분산분석 (0) | 2023.07.30 |
38. 최소최대문제와 분류문제(with 선형판별분석) (0) | 2023.07.27 |
37. 축차확률비 검정 (0) | 2023.07.27 |
36. 최강력 검정 (0) | 2023.07.26 |