본문 바로가기

대외활동/ABC 지역주도형 청년 취업역량강화 ESG 지원산업

[ABC 220923] 지도 학습 알고리즘 - 선형 모델 정리

반응형

선형 모델 - 장단점과 매개변수

  • 선형 모델의 주요 매개변수는 회귀 모델에서 alpha였고 LinearSVC와 LogisticRegression에서는 C
    • alpha 값이 클수록, C 값이 작을수록 모델이 단순해짐(특별히 회귀 모델에서 이 매개변수를 조정하는 일이 매우 중요)
    • 보통 C와 alpha는 로그 스케일로 최적치를 정함
  • L1 규제를 사용할지 L2 규제를 사용할 지를 정해야 함
    • 중요한 특성이 많지 않다고 생각하면 L1 규제를 사용
    • 그렇지 않으면 기본적으로 L2 규제를 사용
    • L1 규제는 모델의 해석이 중요한 요소일 때도 사용할 수 있음
    • L1 규제는 몇 가지 특성만 사용하므로 해당 모델에 중요한 특성이 무엇이고 효과가 어느 정도인지 설명하기 쉬움
  • 선형 모델은 학습 속도가 빠르고 예측
  • 회귀와 분류에서 본 공식을 사용해 예측이 어떻게 만들어지는지 비교적 쉽게 이해할 수 있다는 것
    • 계수의 값들이 왜 그런지 명확하지 않을 때가 종종 있음
    • 특히 데이터 셋의 특성들이 서로 깊게 연관되어 있을 때 그렇고, 이럴 땐 계수를 분석하기가 매우 어려움
    • 선형 모델은 샘플에 비해 특성이 많을 때 잘 작동
    • 다른 모델로 학습하기 어려운 매우 큰 데이터 셋에도 선형 모델을 많이 사용 but 저차원 데이터셋 X
LIST