🪴 Hayul's digital garden

Search

Search IconIcon to open search

Machine Learning

Last updated Mar 14, 2023 Edit Source

# ML 대표 알고리즘

Note

일반적으로 Decision Tree & Logistic Regression 이 설명력이 좋아서 자주 쓰인다. 그러나 최근에는 Gradient Boosting 계열도 자주 쓰이고 있다.

# ML system 종류의 대표 구분 3가지

1. 사람의 감독하에 프로그램이 훈련하는 것인지 여부

2. 실시간으로 점진적인 학습을 하는지 여부

3. 기존의 데이터와 새로운 데이터를 간단히 비교분석하는 것인지 혹은 훈련 데이터 셋으로부터 패턴을 발견하여 예측 모델을 만드는지 여부

# ML 문제 해결 순서

  1. EDA & Visualization
    1. 학습 데이터와 테스트 데이터의 분포가 동일한지 여부를 파악한다
  2. 활용할 모델 알고리즘들을 정한다
  3. Hyper parameter tuning을 수행한다
  4. Cross Validation 기반 학습을 진행한다.
  5. 유의미한 결과가 나오는 알고리즘 및 Hyper parameter Case를 기반으로 학습 데이터 전체를 학습한다.
  6. 테스트 결과를 확인한다.

# Techniques