본문 바로가기

카테고리 없음

[AWS] SageMaker로 Auto ML 사용하기

 

1. SageMaker에서 Studio 생성 > Studio로 시작

 

 

2. 좌 상단 AutoML 클릭 -> Create AutoML expriment 선택

 

3. S3버켓에 미리 올려둔 데이터를 업로드

auto split data -> train / test 나눠줄수 있는 기능

Select 누르고 다음 화면으로

4. target(label)과 feature type을 선택할 수 있는 화면

 

 

5. 알고리즘 / 최적화 선택

Auto - 내부적으로 알아서 내 데이터에 맞는 기법 찾아서 쓰겠다

Ensemblig - 앙상블 기법. 앙상블 계열 알고리즘이 나오고, LGB, XGB, RF, 토치로 쌓은 뉴럴넷 등이 보인다.

HPO - 하이퍼파라미터 최적화 선택.

 

 

6. 배포(Deployment)

Auto deploy -> 활성화시 자동 배포

옵셔널하게 세팅할 수 있는 부분인데, 

Problem type(reg인지, clf지, clf라면 바이너리인지 멀티클래스인지) / obj metric(mse, f1 등등) 정도만 선택해보았다

 

이렇게 하고 CREATE 버튼 누르면 끝!

이렇게 하면 AWS 클라우드 서버상에서

데이터 전처리 > ML모형 > 학습 및 최적화 > 최종 추론(예측) 까지 알아서 다~ 해준다.

 

Best Model 까지 뽑아주고.. 나머지 이력에 대해서도 다 기록을 남겨놓는다.

모형에 관한 데이터도 S3 버킷안에 남아있는걸 확인할 수 있다.

 

 

이게 AutoML의 기본형이라고 주장한다.

데이터셋에 따라 시간은 다르겠고.. Automl 돌기까지 나 같은 경우는 30분정도 걸렸다.