교수님 몇가지 질문이 있어서 글 올립니다.
1. 정상성 r.v ( = 정상성 시계열 구성하고 있는 random variable) 들이 강외생변수가 될 수 있는 이유가 궁금합니다.
강외생변수란 현재 정보 집합 안에 과거,현재,미래 확률변수에 대한 정보를 다 담고 있는 변수를 지칭합니다. 정상성r.v.가 강외생변수가 될 수 있으려면 미래 시점의 확률변수 X(t+h) 가 현재의 정보집합 안에 포함되어 있어야 합니다. 이렇게 될 수 있는 이유가 시계열이 정상성 조건 만족하고 ARIMA form 으로 표현가능할 경우 앞서 배웠던 forecast generating model 통해서 X(t+h) 를 추정할 수 있기 때문인가요?
2. euler equation 별(t) * 강외생변수 Z(t) 에서 별(t) 안에 들어있는 확률변수( = C(t)라 가정) 가 약정상성 r.v이고 Z(t) 역시 약정상성 r.v 라면 이 때는 별(t) 안에 있는 파라미터 ( B) 를 어떻게 추정할 수 있나요?
약정상성R.V(C(t)) 와 약정상성 R.V(Z(t)) 를 곱하면 약정상성R.V가 되는게 아니라면, 이 E(C(t)*Z(t)) = 0 이더라도 C(t)*Z(t) 의 표본평균이 E(C(t)*Z(t)) 로 확률수렴하지 않을 수 있기 때문에 GMM 방식으로 B 추정할 수 없을것 같습니다. 제가 아는 선은 확률변수가 iid 이거나 정상성 r.v 일 경우에는 MM 방식으로 통계량 구했을 때 일치성 지닌다 까지고 그 외의 경우는 모릅니다. 그럼, 이 때는 어떤 방식으로 추정해야 하나요?
제가 이 질문 드리는 이유는 근래의 경제학에서 의사결정 주체는 forward looking 이기에 목적함수에도 미래변수가 포함되어 있고 제약식에도 미래변수가 포함되어 있어서 오일러 방정식의 확률변수나 강외생변수가 다 약정상성 r.v. 일 경우가 많으리라 추측해서 입니다.
3. 2SLS 방식으로 B^(iv) 추정할 때 best W matrix가 노트에 보니 t(Z) (= transpose(Z)) * Z 라고 나와있는데 GMM 방식에서는 best W matrix가 장기분산(Z)의 역행렬입니다. 그러면 2SLS 방식에서도 best W = var( Z) = E( t(Z) *Z) 가 되어야 할 거 같습니다. 근데 E( ) 은 어디로 사라진 건가요? E( t(Z) *Z) 대신 t(Z) *Z 를 사용하면 첫번째 LS 에서 X^ = Pz*X 을 구할 수 있기 때문에 그런건가요?
4. GMM 방식에서 best W matrix를 장기분산(Z) matrix ( = S0) 의 역행렬로 잡는 이유가 [ 별(t) 달(t) ] invers( S0) [ 별(t) 달(t) ] ' 가 표준 정규 변수의 제곱 형태이므로 이게 카이제곱 분포 (df =2 ) 따르고 그러면 뭔가를(?\) test 하기에 편리하기 때문이라고 하셨습니다. 그러면 이 때는 S0 matrix에서 off diagonal term cov(별(t),달(t)) 가 0 이 되는 건가요?? 참고로 별(t),달(t) 는 각 외생변수와 iid U(t) 곱의 표본평균을 지칭합니다.
2. euler equation 별(t) * 강외생변수 Z(t) 에서 별(t) 안에 들어있는 확률변수( = C(t)라 가정) 가 약정상성 r.v이고 Z(t) 역시 약정상성 r.v 라면 이 때는 별(t) 안에 있는 파라미터 ( B) 를 어떻게 추정할 수 있나요?
약정상성R.V(C(t)) 와 약정상성 R.V(Z(t)) 를 곱하면 약정상성R.V가 되는게 아니라면, 이 E(C(t)*Z(t)) = 0 이더라도 C(t)*Z(t) 의 표본평균이 E(C(t)*Z(t)) 로 확률수렴하지 않을 수 있기 때문에 GMM 방식으로 B 추정할 수 없을것 같습니다. 제가 아는 선은 확률변수가 iid 이거나 정상성 r.v 일 경우에는 MM 방식으로 통계량 구했을 때 일치성 지닌다 까지고 그 외의 경우는 모릅니다. 그럼, 이 때는 어떤 방식으로 추정해야 하나요?
제가 이 질문 드리는 이유는 근래의 경제학에서 의사결정 주체는 forward looking 이기에 목적함수에도 미래변수가 포함되어 있고 제약식에도 미래변수가 포함되어 있어서 오일러 방정식의 확률변수나 강외생변수가 다 약정상성 r.v. 일 경우가 많으리라 추측해서 입니다.
******************************
GMM 입문에서 언급한 내용과 유사하게 위 질문은 부정적인 상황을 상정하고 있음. 그러기에 긍정적인 답이 나오려면 무엇인가 추가적인 내용이 상정되어야 함.
중요한 것은 표본 직교조건이 CLT를 만족한다는 측면임. 그러기에 개별변수의 성질이 그 측면이 성립되도록 하는 범주 내에 존재한다는 것이 핵심. (약정상성은 강정상성의 성질 가운데 일부만 만족하는 것이기에 약 정상시계열이 더 넓은 집합. 그러므로 약정상성은 필요조건을 충족하는 셈임.)
제가 이 질문 드리는 이유는 근래의 경제학에서 의사결정 주체는 forward looking 이기에 목적함수에도 미래변수가 포함되어 있고 제약식에도 미래변수가 포함되어 있어서 오일러 방정식의 확률변수나 강외생변수가 다 약정상성 r.v. 일 경우가 많으리라 추측해서 입니다.
***********************************
오일러 식은 조건기대를 담고 있기에 변수들의 성질이 조건기대로서 표현되는 것이 자연스러운 진행. 그런 관점에서 "별"은 흔히 martingale difference임. [martiangale difference는 이분산을 지닐 수 있음.]
3. 2SLS 방식으로 B^(iv) 추정할 때 best W matrix가 노트에 보니 t(Z) (= transpose(Z)) * Z 라고 나와있는데 GMM 방식에서는 best W matrix가 장기분산(Z)의 역행렬입니다. 그러면 2SLS 방식에서도 best W = var( Z) = E( t(Z) *Z) 가 되어야 할 거 같습니다. 근데 E( ) 은 어디로 사라진 건가요? E( t(Z) *Z) 대신 t(Z) *Z 를 사용하면 첫번째 LS 에서 X^ = Pz*X 을 구할 수 있기 때문에 그런건가요?
*************************************
E( t(Z) *Z) 의 일치추정량을 담고 있는 목적함수를 최소화하여야 데이터에서 계산 가능한 추정량을 얻을 수 있기 때문.
4. GMM 방식에서 best W matrix를 장기분산(Z) matrix ( = S0) 의 역행렬로 잡는 이유가 [ 별(t) 달(t) ] invers( S0) [ 별(t) 달(t) ] ' 가 표준 정규 변수의 제곱 형태이므로 이게 카이제곱 분포 (df =2 ) 따르고 그러면 뭔가를(?\) test 하기에 편리하기 때문이라고 하셨습니다. 그러면 이 때는 S0 matrix에서 off diagonal term cov(별(t),달(t)) 가 0 이 되는 건가요?? 참고로 별(t),달(t) 는 각 외생변수와 iid U(t) 곱의 표본평균을 지칭합니다.
****************************************
뭔가를 test하는 측면 보다는 그것이 optimal (Asymptotic variance가 최소가 되는 추정량을 낳게 한다는 점에서) 이기 때문. Longrun variance matrix는 보통의 variance matrix에서 처럼 일반적으로 diagonal matrix가 아님. 즉 장기공분산은 특수한 상황이 아니라면 영이 아님.
1. 정상성 r.v ( = 정상성 시계열 구성하고 있는 random variable) 들이 강외생변수가 될 수 있는 이유가 궁금합니다.
강외생변수란 현재 정보 집합 안에 과거,현재,미래 확률변수에 대한 정보를 다 담고 있는 변수를 지칭합니다. 정상성r.v.가 강외생변수가 될 수 있으려면 미래 시점의 확률변수 X(t+h) 가 현재의 정보집합 안에 포함되어 있어야 합니다. 이렇게 될 수 있는 이유가 시계열이 정상성 조건 만족하고 ARIMA form 으로 표현가능할 경우 앞서 배웠던 forecast generating model 통해서 X(t+h) 를 추정할 수 있기 때문인가요?
*********************************
강외생성은 정상성과는 별개의 개념. 알다시피 모든 t에 대하여 E(u_t | X)=0 의 성질을 갖는 x를 의미. 정상성을 지닐 수도 (이분산을 지님으로 인해) 아닐 수도 있음.