[ABC 220923] 지도 학습 알고리즘

최근접 이웃
- 작은 데이터셋일 경우, 기본 모델로서 좋고 설명하기 쉬움
선형 모델
- 첫 번째로 시도할 알고리즘. 대용량 데이터셋 가능. 고차원 데이터에 가능
나이브 베이즈
- 분류만 가능. 선형 모델보다 훨씬 빠름. 대용량 데이터셋과 고차원 데이터에 가능. 선형 모델 보다 덜 정확함
결정 트리
- 매우 빠름. 데이터 스케일 조정이 필요 없음. 시각화하기 좋고 설명하기 쉬움
랜덤 포레스트
- 결정 트리 하나보다 거의 항상 좋은 성능을 냄. 매우 안정적이고 강력함. 데이터 스케일 조정 필요 없음. 고차원 희소 데이터에는 잘 안맞음
그레이디언트 부스팅 결정 트리
- 랜덤 포레스트보다 조금 더 성능이 좋음. 랜덤 포레스트보다 학습은 느리나 예측은 빠르고 메모리를 조금 사용. 랜덤 포레스트보다 매개변수 튜딩이 많이 필요함
서포트 벡터 머신
- 비슷한 의미의 특성으로 이뤄진 중간 규모 데이터셋에 잘 맞음. 데이터 스케일 조정 필요. 매개변수에 민감
신경망
- 특별히 대용량 데이터셋에서 매우 복잡한 모델을 만들 수 있음. 매개변수 선택과 데이터 스케일에 민감. 큰 모델은 학습이 오래 걸림

LIST

PORTFOLIO_SY