일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- Optimization
- 프로그래머를 위한 선형대수 #선형대수 #고유값 #고유벡터 #야코비 회전법 #QR법 #하우스홀더반사 #행렬회전
- 프로그래머를 위한 선형대수 #선형대수 #고유분해 #고윳값 #고유벡터
- 미적분 #평균값 정리 #로피탈의 정리 #접선의 방정식
- 미적분
- 미적분 #사인과 코사인의 도함수
- 프로그래머를 위한 선형대수 #선형대수 #고유값 #고유벡터 #고유분해
- 프로그래머를 위한 선형대수 #선형대수 #행렬계산
- 시계열분석 #Time-Series Analysis #이상탐지 #Anomaly Detection #Spectral Residual #CNN #SR-CNN
- lightweightmmm
- bayesian inference
- 미적분 #접선의 방정식 #최적화 #뉴턴법 #뉴턴-랩슨법
- Media Mix Modeling
- bayesian
- Marketing Mix Modeling
- 수리통계
- mmm
- 프로그래머를 위한 선형대수 #선형대수 #LU분해
- Today
- Total
목록분류 전체보기 (99)
문과생 네버랜드의 데이터 창고

노름이란? 1) 벡터 공간에서 정의되는 함수로, 벡터의 성질을 어떤 실수(Real Number)로 변환하는 함수를 의미한다. ${(1)}$ 예를 들어, 유클리드 공간에서 정의되는 L2-Norm은 벡터의 직선 크기를 의미한다. L2 Norm의 예시 3차원 공간에서 정의된 벡터 X에 대해 '최단 거리 크기'를 알고 싶다면 L2 Norm을 사용한다. 그 크기는 0보다 큰 실수인 $\sqrt{3}$이다. 2) 엄밀한 수학적 정의는 다음과 같이 내릴 수 있다. 벡터 공간 V에서, Norm X는 $X \rightarrow \mathbb{R}^{1}$을 수행하는 실함수(real-valued Function)이다. Norm 함수를 p라고 할때, Norm은 다음의 세가지 조건을 만족해야한다 -. 삼각 부등식 : 모든 $..

중심극한정리의 다변량 확장 1) 단변량에서 중심극한정리를 살펴보았다. -. 한편, 단변량 정규분포가 존재하는가 하면, 이를 다변량에 대하여 일반화한 다변량 정규분포 또한 존재하였다. -. 마찬가지의 논리로, 단변량 중심극한정리를 다변량에 적용하는것도 가능하다. 2) 다변량 확장을 위해 알아야 하는 사실들 ${(1)}$ L2 Norm -. 벡터의 크기를 측정 가능하도록 하는 측도 -. 벡터 $v \in R^{n}$에 대하여 v의 L2 Norm은 다음과 같이 정의할 수 있다. $$ ||v|| = \sqrt{\sum_{i = 1}^{n} v_{i}^{2}} $$ -. 이 때, $v_{i}$는 벡터 v의 $1,\dots,n$ 번째 요소이다 ${(2)}$ 다음의 경우는 단변량에서의 정리가 다변량에서도 공통적으로 ..

중심극한정리의 중요성 1) 중심극한정리의 정의 ${(1)}$ 중심극한정리는 -. (모수를 모르는 어떤 임의의 분포에서) 샘플들을 많이 추출하여 -. 모수를 추정하도록 하는 샘플들의 통계량(즉, 추정량)을 구할 경우 -. 그 통계량은 많은 경우 정규분포로 수렴한다. -. 이 때, 통계량에는 우리가 익히 알고있는 평균 등이 포함된다. 특히 평균은 $N(\mu, \frac{\sigma^{2}}{n})$, 혹은 표준화를 수행할 경우 $N(0,1)$로 수렴한다. ${(2)}$ 엄밀한 정의는 다음과 같이 내릴 수 있다. $[X_{1}, \dots X_{n}]$을 평균 $\mu$와 분산 $\sigma^{2}$인 분포에서 추출한 확률표본의 집합이라고 하자. 다음의 통계량을 정의하자 $$Y = \frac{\sqrt{n}..
분포수렴이란 1) 확률변수가 갖는 자산 중 하나인 '분포'의 수렴에만 집중한 수렴 정의법 ${(1)}$ 엄밀하게 정의하면 다음과 같이 나타낼 수 있다. $[X_{n}]$ 이 확률변수의 집합이고 X가 어떤 확률변수라고 하자. $F_{X_{n}}$과 $F_{X}$를 각각의 확률변수들의 CDF 라고 하자. $C(F_{x})$를 함수 $F_{X}$가 연속인 모든 정의역의 점의 집합이라고 할 때 $$lim_{n \rightarrow \infty} F_{X_{n}} = F_{x}$$(단, X는 $x \in C(F_{X})$에 대하여 유효하다) 가 참이면 $X_{n}$을 $X$에 대하여 분포수렴한다고 하고, 상징적으로 $$X_{n} \overset{D}{\rightarrow} X$$ 로 표현한다. 2) 마찬가지로 확..
확률수렴이란? 1) 분포의 극한과 수렴 ${(1)}$ $[X_{n}]$을 어떤 확률변수들의 집합이라고 하자. X를 동일한 표본공간에 정의된 확률변수라고 하자. -. 이 때, $X_{n}$에서 n을 매우, 무수히, 많이 뽑는다고 가정하자. 요컨데 $n \rightarrow \infty$ 이다. -. 이런 경우, 무수히 많은 $X_{n}$은 점차적으로 X라는 확률변수에 가까워질 수 있다. ${(2)}$ 이 때, 우리는 이 무수히 많이 뽑은 $X_{n}$이 X로 다가가는 현상을 엄밀하게 정의할 필요성이 생긴다. -. $X_{n}$이 X로 점차 다가가는 현상을 수렴한다 라고 표현하고, 이 수렴을 정의하기 위한 방법론은 다음 두가지가 있다. -. 분포수렴과 확률수렴이 그것이다. 2) 확률수렴 ${(1)}$ 확률 ..

부트스트랩이란 1) 표본을 이용하여 지속적인 복원(혹은 비복원) 추출을 반복하여 모수를 추정하는 추정량의 분포를 알아내는 방법론 ${(1)}$ 모수를 추정하는 추정량의 분포를 추정하기 위한 시뮬레이션이다 ${(2)}$ 추정량에 대한 분포를 시뮬레이션이기 때문에 표본(의 실현값)을 이용한다. ${(3)}$ 다표본 검정의 경우 비복원을 사용하고, 일표본 검정의 경우 복원 추출을 활용한다. ${(4)}$ 샘플이 n개라면, 추출도 n번 수행하여 n개의 재추출을 수행한다. 부트스트래핑 기법을 이용하여 샘플의 평균과 분산을 추정하기 위한 분포를 시뮬레이션하는 예시 애니메이션 처음에 어떤 분포인지도 알 수 없던 샘플의 평균에 대한 히스토그램은 점차적으로 정규분포로 수렴하는 것을 볼수 있다. 이를 이용하여 우리는 샘플..

2024-12-16 채택-기각 알고리즘에 대한 내용 대거 보강 몬테카를로 방법1) 특정한 분포나 표본(Sample)로부터 역으로 관측값을 생성하는 방법론${(1)}$ 반복된 무작위 추출을 이용하여 문제를 푸는 목적이 되는 확률분포를 근사적으로 모델링한다.-. 즉, 무작위 추출된 표본값을 근사적으로 모델링된 분포를 거쳐 변환한 시뮬레이션 실현값은 우리가 알길 원하는 확률분포의 실현값으로 간주해도 무방하다-.몬테카를로 방법을 통해, 실질적으로 닫힌 형태로 분포를 구할 수 없는 현실의 많은 문제를 시뮬레이션을 통해 대리 확인할 수 있다는 점에서 장점을 가진다.-. 그러나, 수많은 무작위 반복 실험을 거쳐야하기 때문에 뛰어난 컴퓨팅파워가 없는 경우 실험이 어려운 경우가 많다.${(2)}$ 구체적으로는 다음의 단..

카이제곱 검정이란 1) 카이제곱 분포에 기반한 가설검정 방법 ${(1)}$ 각 명목형 데이터의 빈도(Count)를 확률변수로 취급하고, 관측값과 기댓값 사이에 유의미한 차이가 있는지를 검정 ${(2)}$ 다음의 가설을 검정한다. -. $H_{0}$ : $p_{1} = p_{10} / p_{2} = p_{20} / ... / p_{k-1} = p_{(k-1)0}$ -. $H_{1}$ : 적어도 하나는 다르다 -. 이때, $p_{k-1}$은 검정의 대상이 되는 지정된 어떤 값이다. 2) 카이제곱 검정식의 유도 ${(1)}$ 2차까지의 항을 우선 구해보고, 이를 토대로 일반화된 패턴을 끌어내본다. -. $ X_{1} $를 다변량 정규분포를 구성하는 확률변수 중 하나라고 하자. $$ X_{1} \sim b(n,..