Machine Learning Workflow : 머신러닝 알고리즘을 이용하여 문제를 해결하는 방법론. 또는 머신러닝 프로젝트 수행 방법.
•
분석 문제 정의 → 데이터 수집 → 탐색적 데이터 분석(EDA) → 피처 엔지니어링 → 예측 모델 개발 → 서비스 적용 순서로 진행된다.
•
머신러닝 기술을 사용하는 것을 전제로 하기 때문에, 각 모듈별로 머신러닝을 이용하여 문제를 해결하는 것에 초점이 맞춰져 있다.
•
모듈 1이 제일 중요하다. 즉, 문제 정의가 제대로 되어있지 않으면 뒤에 모듈들을 아무 의미가 없다!
•
특히, 분석 데이터 정의와 머신러닝 문제 정의가 중요하다!
참고자료
•
Google Cloud Platform에서 제작한 영상인데, 개인적으로 ML workflow에 대해서 간결한 예제로 정말 디테일하게 잘 설명한 영상이라고 생각한다. What a Masterpiece!
•
같은 Google Cloud Platform에서 설명한 ML workflow 글. 위에 영상을 보고 자세히 읽어보면 좋다.
•
ML workflow에 대해 한글로 되어있는 블로그. (밑에 북마크가 이상하게 나온다.. 딥러닝을 이용한 자연어처리 위키북스에 실려있는 파트)
요약
•
ML workflow라는 것은 머신러닝 방법을 이용해서 문제를 해결하는 것을 말한다.
•
ML workflow에서 가장 중요한 건 “문제 정의 파트” 이다!