시스템을 상태방정식으로 표현 할때 내부 변수의 최적 추정 방법은 다음과 같다.
실 세상에서는 많은 측정의 문제가 아래와 같이 표현 된다.
y(t)=∫Th(t,τ)θ(τ)dτ+n(t)
y(t)는 측정(observation or measurement) T는 적분 범위이고, θ(τ) 는 우리가 알려고 하는 내부 변수이다. h(t,τ)는 시스템의 특성(characteristic) 함수이다. 내부변수를 알려면 노이즈로 인하여 에러가 발생한다. 계산의 용의 성을 위하여 위식은 아래와 같이 discrete 형태로 만들어진다.
Y=Hθ+N
여기서 Y 은 n×1, H 은 n×k matrix (n>k), θ 은 k×1, N 은 n×1 벡터 이고 Ni i=1,...,n 은 i번째 Yi의 측정값과 연관 되어 있다. 이때 E[N]=0 이라고 가정한다.
여기서 θ로 부터 추정값 ˆθ 을 가장 잘 추정 할수 있는 방법을 알아본다.
ˆθ 이 Y의 선형함수로 제안하면
ˆθ=BY
로 나타낼수 있다. 여기서 B는 Y에 의존 적이지 않다. 이것은 추정 이론에서 가장 중요한 기본적인 문제이며 여러 책에서 소개 되는 내용이다.
B를 계산하기 전에 계산을 위한 기본적인 내용을 살펴본다.
스칼라 함수를 벡터로 미분
q(t)를 스칼라 함수, x=(x1,....,xn)T 라고 하면
dq(x)dx=(∂q∂x1,...,∂q∂xn)T
q(x)를 x로 미분하면 열 벡터가 되고 i 번째 요소는 q(x)를 xi로 미분한 값이다.
quadratic forms 미분
A를 real-symmetric n×n 행렬이라고 하고 x 를 어떤 n-벡터라고 하자. 그러면 quadratic forms 미분은
q(x)=xTAx
x로 미분을 하면
dq(x)dx=2Ax
이다.
증명 :
q(x)=n∑i=1n∑j=1xiaijxj=n∑i=1x2iaii+n∑i=n∑jaijxixj
그러므로
∂q(x)∂xk=2xkakk+2n∑i≠kakixi=2n∑i=1akixi=dq(x)dx=2Ax
스칼라 곱의 미분
a와 x을 n-벡터라고 하자. y=aTx
dydx=a.
x, y를 two n-벡터 그리고 A를 n×n 행렬이라고 하자. q=yTAx
∂q∂x=ATy.
잘보면 변수가 사라지고 transpose가 붙는다.
그럼 다시 본론으로 들어가서
Y=Hθ+N
E[N]=0 임을 다시 상기하고.
K=E[NNT]=σ2I
제곱의 합 S을 최소화 하는 적당한 θ를 찾아보자.
S=(Y−Hˆθ)T(Y−Hˆθ)=∥Y−Hˆθ∥2
S=YTY+ˆθTHTHˆθ−ˆθTHTY−YTHˆθT
이를 계산하면
∂S∂ˆθT=2[HTH]ˆθ−2HTY
HTH가 역행렬이 있다고 가정하면
ˆθLS=(HTH)−1HTY
와 같은 유명한 식이 나온다. LS: Least square
'학술 > 수학' 카테고리의 다른 글
Expected value of Quadratic forms (0) | 2019.05.22 |
---|---|
Orthogonality Principle (0) | 2019.05.07 |
The derivative of a quadratic form (0) | 2019.05.03 |
[미적분] 라이프니츠 규칙 (Leibniz Rule) (2) | 2019.05.01 |
TRANSFORMING DENSITY FUNCTIONS (0) | 2019.04.22 |