목록통계학 (1)
Sanghyun's Stat
잔차(residual)를 이용한 Bootstrapping
선형회귀모형에서 제일 많이 사용되는 bootstrap은 paired bootsrap이다. 이는 data table이 있다면 row를 resampling하는 방식이다. 즉, $(X_i, Y_i)$를 pair로 resampling하는 것이다. 이 방식은 단순하기 때문에 실행하기 쉽다는 장점이 있다. 하지만 influential points가 있는 경우, 크게 영향을 받는다는 단점이 있다. 이는 resampling 과정에서 influential points가 샘플링 되는지에 따라 추정치가 크게 변하기 때문이다. 이 포스트에서는 influential points에 영향을 덜 받는 residual bootstrap을 알아보자. 1. Algorithm 먼저, 가장 단순한 선형회귀 분석의 경우를 보자. 데이터 $\{..
통계학
2021. 12. 25. 19:19