문과생 네버랜드의 데이터 창고

8. 뉴턴법 본문

미적분

8. 뉴턴법

K JI 2023. 5. 13. 19:24
    1. 정의

      1) f(x) = 0에 도달하는 수렴 방식의 수렴방식의 반복법

      2) 반복법 자체의 방법론은 아래와 같은 예시를 따른다.

      ${(1)}$ $F(X_{n}) = X_{n + 1}$의 무한 수열

      ${(2)}$ 예를 들어, $cos(x_{0})$를 세 번 반복하면

      ${(3)}$ $cos(cos(cos(x_{0})))$이 된다. 즉 계산기의 cos 버튼을 세 번 누르는것과 같다.

      ${(4)}$ 이 경우, $cos(0.7391)$에서 자기 자신과 같은 0.7391이 나오는데 이 지점이 바로 고정점이다.

      반복법 $F(X_{n}) = X_{n + 1}$의 예시. 점차적으로 고정점 0.7391에 가깝게 다가가게 된다.

      ${(5)}$ 이 때, 총 이동 길이는 그 기울기인 $\frac{F(x)}{\partial x}$를 따르는데, 따라서 $F'(x) < 1$이면 이 함수는 결국 특정값으로 수렴하고, $F'(x) \geq 1$ 이면 발산한다.  

      3) 뉴턴법은 반복법을 확장하여 다음의 문제를 푼다
      ${(1)}$ $X_{n+1} = F(x_{n}) = X_{n} - c \cdot f(x_{n})$
      ${(2)}$ 이 때, 적절한 c를 고르면 이 문제를 해결할 수 있게 된다.

      ${(3)}$ 함수를 고정점으로 수렴하게 하는 $x^{n}$의 해 $x^{*}$가 존재한다고 가정하면
      -. $\displaystyle \lim_{x \to x^{*}}x_{n}-c \cdot f(x_{n})=x^{*}-cf(x^{*})=x^{*}=F(x^{*})$

      -. $x^{*}-cf(x^{*})=x^{*}$에서 좌변을 이항하고 정리하면 $f(x^{*}) = 0$을 준다. 이는 우리가 원래 목표로 했던 방정식이다

      -. 만약, $x_{n}$이 $F(x_{n})$의 고정점인$F(x^{*})$로 수렴한다면 첫 번재 방정식 $\displaystyle \lim_{x \to x^{*}}x_{n}-c \cdot f(x_{n})$ 따라 $f(x) = 0$또한 도출할 수 있으며,

      -. 이제 우리의 목표는 $x^{n}$을 $x^{*}$에 가장 빠르게 수렴시키기 위한 $c$를 찾아내는 것이다.

      ${(4)}$ 프레임을 바꿔서, $x_{n} - c \cdot f(x_{n})$ 에서 $x^{*}$를 찾는 것을 $x_{n} - x^{*}$을 최소하하는 문제로 변환시킨다면

      -. $x_{n+1} - x^{*} = \displaystyle \lim_{x \to x^{*}}(x_{n} - x^{*})-c \cdot f(x_{n} - x^{*})=0$

      -. 이 때, $f(x_{n} - x^{*})$는 기울기로 볼 수 있고, 이를 미분의 형식으로 다시 쓰면
      $A = \frac{f(x^{*})}{\partial x^{*}}=f'(x^{*})$

      -. $x_{n+1} - x^{*} = \displaystyle \lim_{x \to x^{*}}(x_{n} - x^{*})-c \cdot A \cdot (x_{n} - x^{*})=\displaystyle \lim_{x \to x^{*}}(1 - c \cdot A) \cdot (x_{n} - x^{*})$

      -. 위 식을 해석하면 $x_{n+1} - x^{*}$ 이라는 '다음 반복의 오차'는 $(x_{n} - x^{*})$ 이라는 '지금 반복의 오차' 에 파라미터 $(1 - c \cdot A)$를 계속 곱하는 것이 된다.
      ${(5)}$ 이제 거의 다 왔다. $(1 - c \cdot A) < 1$이라면 '다음 반복의 오차''지금 반복의 오차'보다 항상 작게 되며, 어느 순간 우리의 목표였던 $x_{n+1} - x^{*} = 0$을 향에 나아가게 된다. 

      -. 이 때, $(1 - c \cdot A)$에서 $ c = \frac{1}{A} = \frac{1}{f'(x^{*})}$ 는 $(1- c \cdot A)$를 0으로 만든다=> 가장 최선의 선택이 된다.

      -. 물론, 우리는 이 방정식의 해 $x^{*}$을 현재 시점에서 모른다. $x^{*}$은 우리가 처음 있다고 가정한, 우리가 구해야하는 대상이기 때문이다.

      -. 따라서, $x^{*}$을 우리가 현재 알수있는 값 $x^{n}$으로 대체하면
      $$ x_{n+1} = x_{n} - \frac{1}{f'(x^{n})} \cdot f(x_{n}) = x_{n} - \frac{f(x_{n})}{f'(x^{n})} = 0 $$
      이 식이 바로 오차를 0에 최대한 가깝게 만드는 우리가 도출 가능한 최선의 방법론, 즉 뉴턴법이다.

'미적분' 카테고리의 다른 글

10. 연쇄 법칙  (0) 2023.05.17
9. 평균값 정리와 로피탈의 정리  (0) 2023.05.15
7. 최대점과 최소점(정류점)  (2) 2023.05.09
6. 미분소  (0) 2023.05.07
4. 선형 근사  (2) 2023.05.06