일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 미적분
- Marketing Mix Modeling
- mmm
- 프로그래머를 위한 선형대수 #선형대수 #고유값 #고유벡터 #고유분해
- 프로그래머를 위한 선형대수 #선형대수 #행렬계산
- Media Mix Modeling
- 프로그래머를 위한 선형대수 #선형대수 #고유값 #고유벡터 #야코비 회전법 #QR법 #하우스홀더반사 #행렬회전
- bayesian inference
- 프로그래머를 위한 선형대수 #선형대수 #LU분해
- 미적분 #접선의 방정식 #최적화 #뉴턴법 #뉴턴-랩슨법
- 수리통계
- lightweightmmm
- 미적분 #평균값 정리 #로피탈의 정리 #접선의 방정식
- Optimization
- bayesian
- 미적분 #사인과 코사인의 도함수
- 시계열분석 #Time-Series Analysis #이상탐지 #Anomaly Detection #Spectral Residual #CNN #SR-CNN
- 프로그래머를 위한 선형대수 #선형대수 #고유분해 #고윳값 #고유벡터
- Today
- Total
목록수리통계 (56)
문과생 네버랜드의 데이터 창고
확률수렴이란? 1) 분포의 극한과 수렴 ${(1)}$ $[X_{n}]$을 어떤 확률변수들의 집합이라고 하자. X를 동일한 표본공간에 정의된 확률변수라고 하자. -. 이 때, $X_{n}$에서 n을 매우, 무수히, 많이 뽑는다고 가정하자. 요컨데 $n \rightarrow \infty$ 이다. -. 이런 경우, 무수히 많은 $X_{n}$은 점차적으로 X라는 확률변수에 가까워질 수 있다. ${(2)}$ 이 때, 우리는 이 무수히 많이 뽑은 $X_{n}$이 X로 다가가는 현상을 엄밀하게 정의할 필요성이 생긴다. -. $X_{n}$이 X로 점차 다가가는 현상을 수렴한다 라고 표현하고, 이 수렴을 정의하기 위한 방법론은 다음 두가지가 있다. -. 분포수렴과 확률수렴이 그것이다. 2) 확률수렴 ${(1)}$ 확률 ..

부트스트랩이란 1) 표본을 이용하여 지속적인 복원(혹은 비복원) 추출을 반복하여 모수를 추정하는 추정량의 분포를 알아내는 방법론 ${(1)}$ 모수를 추정하는 추정량의 분포를 추정하기 위한 시뮬레이션이다 ${(2)}$ 추정량에 대한 분포를 시뮬레이션이기 때문에 표본(의 실현값)을 이용한다. ${(3)}$ 다표본 검정의 경우 비복원을 사용하고, 일표본 검정의 경우 복원 추출을 활용한다. ${(4)}$ 샘플이 n개라면, 추출도 n번 수행하여 n개의 재추출을 수행한다. 부트스트래핑 기법을 이용하여 샘플의 평균과 분산을 추정하기 위한 분포를 시뮬레이션하는 예시 애니메이션 처음에 어떤 분포인지도 알 수 없던 샘플의 평균에 대한 히스토그램은 점차적으로 정규분포로 수렴하는 것을 볼수 있다. 이를 이용하여 우리는 샘플..

2024-12-16 채택-기각 알고리즘에 대한 내용 대거 보강 몬테카를로 방법1) 특정한 분포나 표본(Sample)로부터 역으로 관측값을 생성하는 방법론${(1)}$ 반복된 무작위 추출을 이용하여 문제를 푸는 목적이 되는 확률분포를 근사적으로 모델링한다.-. 즉, 무작위 추출된 표본값을 근사적으로 모델링된 분포를 거쳐 변환한 시뮬레이션 실현값은 우리가 알길 원하는 확률분포의 실현값으로 간주해도 무방하다-.몬테카를로 방법을 통해, 실질적으로 닫힌 형태로 분포를 구할 수 없는 현실의 많은 문제를 시뮬레이션을 통해 대리 확인할 수 있다는 점에서 장점을 가진다.-. 그러나, 수많은 무작위 반복 실험을 거쳐야하기 때문에 뛰어난 컴퓨팅파워가 없는 경우 실험이 어려운 경우가 많다.${(2)}$ 구체적으로는 다음의 단..

카이제곱 검정이란 1) 카이제곱 분포에 기반한 가설검정 방법 ${(1)}$ 각 명목형 데이터의 빈도(Count)를 확률변수로 취급하고, 관측값과 기댓값 사이에 유의미한 차이가 있는지를 검정 ${(2)}$ 다음의 가설을 검정한다. -. $H_{0}$ : $p_{1} = p_{10} / p_{2} = p_{20} / ... / p_{k-1} = p_{(k-1)0}$ -. $H_{1}$ : 적어도 하나는 다르다 -. 이때, $p_{k-1}$은 검정의 대상이 되는 지정된 어떤 값이다. 2) 카이제곱 검정식의 유도 ${(1)}$ 2차까지의 항을 우선 구해보고, 이를 토대로 일반화된 패턴을 끌어내본다. -. $ X_{1} $를 다변량 정규분포를 구성하는 확률변수 중 하나라고 하자. $$ X_{1} \sim b(n,..
양측검정 1) 가설검정에서 계속해서 확인했던 가설검정은 모두 한쪽 방향으로만 가설을 검정하는 단측검정이었다. ${(1)}$ 예를 들어, 마지막 예제에서 봤던것과같은 다음과 같은 가설이다 $$H_{0} : T_{1} = \omega_{0} \ vs \ H_{1} : T_{1} > \omega_{0}$$ ${(2)}$ 양측검정은 위와 같은 가설을 확장하여, 다음과 같은 가설을 검정할 수 있도록 한다 $$H_{0} : T_{1} = \omega_{0} \ vs \ H_{1} : T_{1} \neq \omega_{0}$$ -. '좌측이 크다'는 가설이 '같지 않다'로 바뀐것에 주목하자 2) (정규분포를 활용한) 평균에 대한 대표본 양측검정 ${(1)}$ X가 평균 $\mu$, 분산 $\sigma^{2}$를 가지..

가설과 가설검정 1) 가설이란? ${(1)}$ 가설, 특히 통계적 가설이란 모수 또는 분포에 대하여 연구자가 주장하는 내용을 말한다. -. 예를 들어서, 홈페이지의 새로운 UI에 대하여 '잠재적 사용자'란 모집단이 존재한다고 가정할 때 -. 사이트에 실제로 유입된 표본들의 (원본 / 개선안)의 클릭률 차이가 모집단에서도 마찬가지로 유의미할 것이라도 주장할 수 있다. 2) 가설 검정이란? ${(1)}$ 연구자가 주장한 가설이 실제로도 유의미한지 참 / 거짓을 판별하는 방법론을 가설검정이라고 한다. ${(2)}$ 가설 검정엔 귀무가설과 대립가설이라는 두 개념이 등장한다. -. 대립가설 : 연구가설이라고도 표현한다. 연구자가 관심을 갖고 있는(즉 연구자가 주창한) 가설을 의미한다. -. 귀무가설 : 영가설이라..

분위수란? 1) 앞서 우리는 확률변수 $[X_{1}, ..., X_{n}]$를 크기 순서대로 정렬하여 추론을 수행하는 순서통계량에 대해 알아보았다. ${(1)}$ 이제 떠올려볼 수 있는 자연스러운 다음 단계는, 순서를 구할수 있었으니 그 순서를 이용하여 확률변수들을 단계로서 구분지을 수 있는 구간값을 구하는 것이다. -. 예를 들어, 우리나라 복지제도에서 수급 대상자를 선정하는 주요 기준인 중위수(Median)는 우리나라 모든 국민 가구를 순서대로 정렬하였을 때 정확히 중간에 있는 사람의 소득을 의미한다. 2) 분위수의 정의와 공식 ${(1)}$ X를 연속형 누적확률함수(CDF) $F(x)$를 갖는 확률변수라고 하자. -. 이 때, $0 < p < 1$에 대하여 p순위 분위수는 다음과 같이 정의한다. $..
순서통계량이란 무엇인가? 1) 모수통계와 비모수통계 ${(1)}$ 지금까지 살펴본 통계적 추론은 모두 어떤 확률분포를 가정하고 논의를 진행해왔다 -. 이항분포, 정규분포 등 분포 가정에서 시작하여 이 분포에서 추출한 확률표본들을 기반으로 통계량을 정의하였다. -. 분포 가정이 없었다 하더라도, 그 확률표본들의 평균은 정규분포를 따른다는 중심극한정리에 의거해서 논의를 진행했기 때문에 확률분포에서 자유롭지 않다. -. 이처럼, 어떤 분포를 가정하고 통계적 추론을 수행하는 통계적 방법론을 모수통계라 한다. ${(2)}$ 모수통계의 맹점은, 매우 엄격한 통계적 가정을 만족해야 비로소 추론이 가능하다는 점이다. -. 표본들의 원 확률변수(즉, 모집단의 확률변수)가 어떤 분포를 따른다고 강력하게 가정이 가능하거나 ..