문과생 네버랜드의 데이터 창고

18. 확률표본과 모수, 그리고 통계량 본문

수리통계

18. 확률표본과 모수, 그리고 통계량

K JI 2023. 6. 26. 18:12
  1. 개요
    1) 현대 통계학의 문제에서 대부분의 의문은 어떤 확률변수 X에 대하여 다음의 질문에 답을 얻는것이다.

    (1) 어떤 확률변수 X에 대하여, 그 확률변수 X의 pdf(혹은 pmf)는 무엇일까?
    (2) pdf(pmf)는 안다고 해도, 그 pdf(pmf)에서 나타나는 파라미터 θ는 무엇일까?

    2) 이 중, 두 번째 질문에 답변하기 위해 필요한 개념이 바로 표본통계량이다.

  2. 표본
    1) 어떤 확률변수 X가 집합 ω에 대해 pdf(혹은 pmf)를 정의 가능하다고 하자.
    (1) 이 때, 확률변수 X와 동일한 분포를 가지면서, X를 통해 n번 샘플링한 [X_{1},X_{2}, ..., X_{n}]가 서로 독립일 경우 확률표본이라고 표현한다.
    -. 위에서 정의한 ①동일한 분포, ②독립일 경우를 특별히 i.i.d(Independent and Identically Distributed)라는 명칭으로 부른다.
    -. iid 조건은 통계적 추론에서 매우 자주 가정하는 조건으로 개념을 이해하고 넘어가는 것이 좋다. 

    (2) 확률 표본 [X1,X2,...,Xn]에 대하여 현실에 결과로 도출된 값들을 실현이라고 표현한다.
    -. 이 때, 이 실현값들은 [x1,x2,...,xn] 으로 표현한다.

  3. 통계량
    1) 확률 표본 [X1,X2,...,Xn]에 대한 변환 함수 T=T([X1,X2,...,Xn])를 정의하자. 이를 통계량 이라고 한다.
    (1) 대표적인 통계량 몇가지를 뽑아보면 아래와 같다.
    -. x1+x2+...+xnn=¯x, T가 평균을 구하는 함수일 때 이는 통계량이다.
    -.  σ2=(xi¯x)2n, 즉 T가 분산을 구하는 함수일 때 이는 통계량이다.

    2) 한편, 이와 같은 논리를 확률 표본 [X1,X2,...,Xn] 뿐만 아니라 그 원천인 확률변수 X에 대하여도 적용할 수 있다.
    (1) 이 과정을 통해 도출된 θ=T(X)를 모수라고 한다.

  4. 불편 추정량
    1) 우리의 목적은 다음과 같다.

    (1) 현실에서 실현된 확률 표본들의 실현을 토대로
    (2) 통계량을 만들고
    (3) 이를 토대로 원천인 확률변수 X의 모수를 추정하는 것이다.

    2) 이때, 통계량과 모수를 연결짓는 징검다리로서 불편추정량이란 개념이 등장한다.
    (1) 불편추정량의 개념은 아래와 같다.
    -. 모수 θ를 갖는 pdf(f;θ)를 가지는 확률변수 X를 정의하자.
    -. 이 때, X에서 독립적으로 추출한(i.i.d) 확률표본 [X1,X2,...,Xn]를 정의하자.
    -. 이 확률표본을 이용한 통계량 T=T([X1,X2,...,Xn])를 정의하자.
    -. 이 때, 이 통계량의 기댓값 E(T)=θ, 즉 그 기댓값이 모수와 같을경우 T를 θ불편추정량 이라고 표현한다.   

    확률변수, 확률표본, 모수, 통계량, 불편추정량의 관계 예시도

    확률변수 X가 베르누이 시행(동전을 던졌을때 앞면이면 1, 뒷면이면 0)을 따를 때,
    그 확률표본 X1,...,Xn의 실현 x1,...,xn의 평균 ¯x
    확률변수 X의 '앞면이 나올 확률' θ불편추정량이다.

    이는 뒤에서 증명할 것이며, 일단은 이런 관계들을 서로 맺고 있다고 확인하자

 

'수리통계' 카테고리의 다른 글

20. 신뢰구간  (0) 2023.06.28
19. 우도와 최대우도추정량  (0) 2023.06.27
17-1 스튜던트의 정리  (0) 2023.06.23
17. T분포와 F분포  (0) 2023.06.22
16. 혼합분포  (0) 2023.06.21