Search
⚛️

00. 들어가는 글

Created
2023/06/22 15:31
Tags
data science
machine learning
deep learning
kaggle
Data Science 101 시리즈 글을 연재해볼까 합니다.
해당 글은 패스트캠퍼스 “데이터 사이언스 초격차 패키지” 강의에 사용한 강의자료를 기반으로 정리한 글입니다.
(사실 강의자료 만든게 아까워서 공개하는건 안비밀..)
해당 강의를 듣지 않으셔도 전혀 문제 없는, 그냥 블로그 글입니다. 순전히 저도 공부하면서 인터넷에서 얻은 정보들을 정리해서 다시 posting하자는 취지입니다.
그리고, 저는 데이터사이언스 분야에서 강의를 업으로 삼고 있습니다. 제가 강의를 진행하는 많은 분들이 글을 보고 정보를 얻으면 좋겠는 마음에 글을 적으려고 합니다ㅎㅎ
해당 시리즈의 전체적인 그림은 다음과 같습니다.
데이터 사이언스 분야 소개머신러닝 개념 소개머신러닝 모델링에 필요한 기초 개념들(수학, 통계, 프로그래밍 기초, Python)데이터 엔지니어링 소개데이터베이스 개념 소개데이터베이스 모델링에 필요한 기초 개념들(RDB, ERD)머신러닝 모델링 프로젝트(feat. Kaggle)MLOps 프로젝트
순으로 진행됩니다.
마지막 MLOps 프로젝트에서는 그냥 앞에서 배운거 모두 사용해서 실제 데이터베이스에 데이터를 적재하는것부터, 해당 데이터를 불러와서 train & inference를 하고 streamlit으로 app demo를 구현하는것까지 진행합니다. 필요하다면, MLFlow 같은 model serving tool도 사용할 예정입니다.
예상에는 시리즈 글을 마무리하는데 1년 정도 걸리지 않을까 합니다! 천천히 정리해두었던 개념들을 공유드릴테니 많은 관심 부탁드립니다