본문 바로가기

대외활동/ABC 지역주도형 청년 취업역량강화 ESG 지원산업

[ABC 220923] 지도 학습 알고리즘 - 요약 및 정리

반응형

각 데이터 모델의 특징

  • 최근접 이웃
    • 작은 데이터셋일 경우, 기본 모델로서 좋고 설명하기 쉬움
  • 선형 모델
    • 첫 번째로 시도할 알고리즘. 대용량 데이터셋 가능. 고차원 데이터에 가능
  • 나이브 베이즈
    • 분류만 가능. 선형 모델보다 훨씬 빠름. 대용량 데이터셋과 고차원 데이터에 가능. 선형 모델 보다 덜 정확함
  • 결정 트리
    • 매우 빠름. 데이터 스케일 조정이 필요 없음. 시각화하기 좋고 설명하기 쉬움
  • 랜덤 포레스트
    • 결정 트리 하나보다 거의 항상 좋은 성능을 냄. 매우 안정적이고 강력함. 데이터 스케일 조정 필요 없음. 고차원 희소 데이터에는 잘 안맞음
  • 그레이디언트 부스팅 결정 트리
    • 랜덤 포레스트보다 조금 더 성능이 좋음. 랜덤 포레스트보다 학습은 느리나 예측은 빠르고 메모리를 조금 사용. 랜덤 포레스트보다 매개변수 튜딩이 많이 필요함
  • 서포트 벡터 머신
    • 비슷한 의미의 특성으로 이뤄진 중간 규모 데이터셋에 잘 맞음. 데이터 스케일 조정 필요. 매개변수에 민감
  • 신경망
    • 특별히 대용량 데이터셋에서 매우 복잡한 모델을 만들 수 있음. 매개변수 선택과 데이터 스케일에 민감. 큰 모델은 학습이 오래 걸림
LIST