교수님 강의노트 내용을 공부하다가 궁금한 점이 생겨서 질문 드립니다.


1. 통계학 복습 프린트에서 확률적 독립이라는 개념에 대한 질문 입니다.

    확률적 독립의 개념 자체에 대한 이해는 크게 어려움이 없었는데요. 이걸 그냥 독립이라고 말 해도 괜찮은지 궁금합니다.

    확률변수 X, Y가 확률적 독립이라는 것과 확률변수 X,Y가 독립이라는 것에 차이가 있을까요?

    몇 가지 자료를 찾아보았는데 그냥 독립이라고 적혀있고 동일하게 정의해 놓은 것도 있는 것 같아서요.


    만약 저게 동일하다면, X, Y가 확률적 독립이면 g(X), h(Y)도 확률적 독립이다 라는 정리에서도 '확률적'이라는 말이 들어가지 않아도 괜찮은 건가요?


2. 두번째 과제의 마지막 문제였던 p53 쪽의 맨 밑의 TF 문제에 대한 질문 입니다.

    (1)의 경우에는 B^(베타헷)의 분산 식을 생각해 보았습니다. 그 분산 식의 분자 부분에 1/n을 곱하면 표본분산이 됩니다.

    그래서 표본분산이 커지면 분자 부분이 커져서 분산이 작아지므로 베타를 정교하게 추정할 수 있다고 했습니다.

    다만 1/n이 곱해지는 것이기 때문에 위의 설명은 n이 고정이라는 것이 전제되어야 맞습니다.

    이 경우 n이 고정되어 있다고 봐야하는 건가요?


   (2)의 경우는 특이치를 어떻게 보아야 할 것 인지 부터 조금 어렵습니다. 통계학에서는 보통 특이치라고 판단되면 많은 경우에 제외시키고 분석하는 것으로 알고 있는데요. 그런 의미에서는 특이치가 포함되어 있는 것이 바람직하지 않다고 생각합니다. 다만 특이치에도 의미가 있다고 판단되면 연구자 주관에 따라 포함시키기도 하는데 이럴 때는 베타를 더욱 정교하게 추정한다는 의미가 맞는 것 같습니다. 어떻게 생각해야 맞는 것인가요?


  (3)의 경우에는 잔차항과 연결지어 생각해야 되는 것인지 궁금합니다. Y가 특이치라는 것은 곧 잔차가 매우 크다는 거라고 생각해 보았습니다. 잔차가 크다는 것은  추정이 잘 이루어지지 않았다는 것이니까 바람직하지 않은 것이라고 생각했습니다. 다만 이렇게 생각하는 것이 맞는지 확신이 안 듭니다. 이렇게 생각하는 것이 맞는 것인가요?


감사합니다.