반응형

데이터 분석 3

K-fold Cross Validation K-겹 교차 검증

회귀변수를 진행할 때는 학습(training)을 위한 데이터 집합이 필요하다. 이 학습 데이터 집합의 종속 변수값을 얼마나 잘 예측하였는지를 나타내는 성능을 표본내 성능 검증(in-sample testing)이라고 한다. 그런데 회귀분석 모형을 만드는 목적 중 하나는 종속 변수의 값을 아직 알지 못하고 따라서 학습에 사용하지 않은 표본의 대해 종속 변수의 값을 알아내고자 하는 것, 즉 예측(prediction)이다. 이렇게 학습에 쓰이지 않는 표본 데이터 집합의 종속 변수 값을 얼마나 잘 예측하는가를 검사하는 것을 표본외 성능 검증(out-of-sample testing) 혹은 교차검증(cross validation)이라고 한다. - (데이터 사이언스 스쿨 발췌) K겹 교차 검증이란 K-fold란 데이터..

데이터 분석 2020.06.18
반응형