본문 바로가기

머신러닝

스태킹 앙상블 모델

기반 모델들이 예측한 값들을 Stacking 형태로 만들어서 메타 모델이 이를 학습하고 예측하는 모델

 

교차 검증 세트 기반의 스태킹은 이에 대한 개선을 위해 개별 모델들이 각각 교차 검증으로 메타 모델을 위한 학습용 스태밍 데이터 생성과 예측을 위한 테스트용 스태킹 데이터를 생성한 뒤 이를 기반으로 메타 모델이 학습과 예측을 수행합니다. 이는 다음과 같이 2단계 스텝으로 구분될 수 있습니다.

 

스텝1 : 각 모델별로 원본 학습, 테스트 데이터를 예측한 결과 값을 기반으로 메타 모델을 위한 학습용/ 테스트용 데이터를 생성합니다.

스텝2 : 스텝 1에서 개별 모델들이 생성한 학습용 데이터를 모두 스태킹 형태로 합쳐서 메타 모델이 학습할 최종 학습용 데이터 세트를 생성합니다. 마찬가지로 각 모델들이 생성한 테스트용 데이터를 모두 스태킹 형태로 합쳐서 메타 모델이 예측할 최종 테스트 데이트 세트를 생성합니다. 메타 모델은 최종적으로 생성된 학습 데이터 세트와 원본 학습 데이터의 레이블 데이터를 기반으로 학습한 뒤, 최종적으로 생성된 테스트 데이터 세트를 예측하고, 원본 테스트 데이터의 레이블 데이터를 기반으로 평가합니다.

 

'머신러닝' 카테고리의 다른 글

파이썬 기반 머신러닝 생태계 이해  (0) 2022.01.21
평가  (0) 2022.01.21
LightGBM  (0) 2022.01.20
XG Boost  (0) 2022.01.20
앙상블_보팅, 배깅, 부스팅  (0) 2022.01.20