[AWS] SageMaker로 Auto ML 사용하기
1. SageMaker에서 Studio 생성 > Studio로 시작
2. 좌 상단 AutoML 클릭 -> Create AutoML expriment 선택
3. S3버켓에 미리 올려둔 데이터를 업로드
auto split data -> train / test 나눠줄수 있는 기능
Select 누르고 다음 화면으로
4. target(label)과 feature type을 선택할 수 있는 화면
5. 알고리즘 / 최적화 선택
Auto - 내부적으로 알아서 내 데이터에 맞는 기법 찾아서 쓰겠다
Ensemblig - 앙상블 기법. 앙상블 계열 알고리즘이 나오고, LGB, XGB, RF, 토치로 쌓은 뉴럴넷 등이 보인다.
HPO - 하이퍼파라미터 최적화 선택.
6. 배포(Deployment)
Auto deploy -> 활성화시 자동 배포
옵셔널하게 세팅할 수 있는 부분인데,
Problem type(reg인지, clf지, clf라면 바이너리인지 멀티클래스인지) / obj metric(mse, f1 등등) 정도만 선택해보았다
이렇게 하고 CREATE 버튼 누르면 끝!
이렇게 하면 AWS 클라우드 서버상에서
데이터 전처리 > ML모형 > 학습 및 최적화 > 최종 추론(예측) 까지 알아서 다~ 해준다.
Best Model 까지 뽑아주고.. 나머지 이력에 대해서도 다 기록을 남겨놓는다.
모형에 관한 데이터도 S3 버킷안에 남아있는걸 확인할 수 있다.
이게 AutoML의 기본형이라고 주장한다.
데이터셋에 따라 시간은 다르겠고.. Automl 돌기까지 나 같은 경우는 30분정도 걸렸다.