Byte Degree : Machine Learning with Python

본 프로그램은 국민대학교 MOU 과정으로 국가 수리과학 연구소, 캐글코리아, 삼성전자 출신의 국내 최고 데이터 분석가들이 직접 감수한 실무 중심 커리큘럼과 체계적인 1:1 관리를 중심으로 진행됩니다.

  • #확률/통계
  • #알고리즘
  • #지도학습
  • #비지도학습
  • #불균형데이터
  • #파이썬
  • #데이터분석
난이도
중급
총 시간
12주
일정 및 기간

2020.6.1 - 2020. 9. 20
(총 16주)

수강 방법

강의 및 과제 제출
전 과정 온라인 진행

담당 및 문의

바이트디그리 운영팀
bytedegree@fastcampus.co.kr

머신러닝 바이트 디그리 1기 모집이 마감되었습니다.
다음 기수 모짐 알림 신청하고,
바이트 디그리의 다양한 혜택을 최저가로 경험하세요.

바이트 디그리는 당신의 커리어에 실질적인 도움을 줄 수 있습니다.


국민대학교 경영 대학원은 데이터 사이언티스트로 활동하고 있는 국내 최대 졸업생을 배출한만큼 공신력을 갖고있습니다. 앞으로 데이터 사이언스 분야의 최신 동향을 반영한 커리큘럼으로 제대로 공부하고 인증할 수 있습니다.
바이트 디그리로 당신의 커리어 증명은 물론, 원하는 목표까지 한 번에 가져가세요.

머신러닝이란?

'방대한 데이터'를 기계가 알아서 분석하고 학습하여 규칙(패턴)을 발견하고 미래를 예측하는 것을 의미합니다.
이는 효과적으로 기회를 포착하고 비즈니스 성과를 극대화하므로 대부분의 산업에서 활용하며
중요성이 매우 높아졌습니다.

데이터 분석 전문가 6인의 노하우를 그대로 담았다!
1:1 관리 프로그램으로 머신러닝을 제대로 배워보세요!

머신러닝 실무에 필요한 수학, 회귀분석, 기본모형, 앙상블, 군집분석&불균형데이터, 최적화까지
현업에서 가장 많이 사용하는 프로젝트로 실력을 다지고 실무 자격 인증서까지 가져갑니다.

직무, 업계 상관없이 이제는 필수역량 '머신러닝'
바이트 디그리로 시간과 실력 모두 잡아보세요!

4개월(16주)압축 완성 코스

머신러닝 실무에 꼭 필요한 핵심 커리큘럼만을 모아 4개월(16주) 투자로 빠르게 집중하여 성장할 수 있도록 이끌어주는 압축 완성 코스입니다.

알찬 구성으로 수강료 대비 높은 가성비

머신러닝 입문 및 머신러닝 활용에 필요한 실무 역량을 모두 가져갈 수 있는 현업 실무진 온라인 강의를 제공 받고, 코드 리뷰 및 질의응답, 실무 역량 인증서까지 온라인에서 한 번에 끝낼 수 있습니다.

수료 후 빠르게 실무 적용 및 응용 가능

산업별로 가장 많이 사용하는 머신러닝 핵심 역량을 갖춘 인재로 성장할 수 있도록 PBL(현업 프로젝트 기반의 학습, Project Based learning) 방식으로 데이터 분석가가 아닌 입문자도 현업에 적용할 수 있도록 만들어 드립니다.


바이트디그리는 온라인으로 제대로 관리받고 마스터하는
프리미엄 교육 과정 입니다.

머신러닝 실무역량 바이트 디그리로 해결하세요!

검증된 커리큘럼

데이터 분석 전문가들이 이중으로 검수한 커리큘럼과 실무 프로젝트로 머신러닝 필수 지식을 학습하도록 하나의 흐름으로 구성했습니다.

온라인 1:1 밀착 학습 관리

현직자의 온라인 심층리뷰와 학습관리로 내 코드를 꼼꼼하게 검토 받으며 자신감 있는 실력을 가져갑니다.

협업 데이터 분석 프로젝트 중심 학습

예시 풀이를 넘어, 7개의 개인 프로젝트로 나만의 결과물과 포트폴리오를 가져갑니다.

현직 강사진과 코치

강사진부터 리뷰어, 코치 모두 현업 데이터 분석가로만 구성되어 머신러닝 개념부터 필수수학, 최적화이론까지 진짜 써먹는 실무를 배웁니다.

공신력있는 국민대 경영대학원 인증과정

국내 데이터 사이언티스트 최다 졸업생을 배출한 국민대학교 경영대학원과 함께 바이트 디그리 교육 프로그램을 공동 개발하여 취업과 커리어에 실질적인 도움을 주는 공신력 있는 프로그램으로 거듭났습니다.

실무능력 인증서 제공

수료자에 한해 커리어 서비스부터 채용에 유리한 '인재등록'까지 무료로 이용할 수 있습니다.

Wanted 이력서 포트폴리오 1:1 코칭

수료자에 한해 커리어 서비스부터 채용에 유리한 '인재등록'까지 무료로 이용할 수 있습니다.

온라인 프라이빗 웨비나

온라인에서 현업 데이터 분석 실무자들과 직접 소통하는 라이브 프라이빗 세미나를 진행합니다.


파이썬 머신러닝 실무 경험을 담은 프로젝트 커리큘럼,
업계 최고의 데이터 분석 전문가에게 배우는 바이트 디그리.

이경택 강사님
Intro/ Part2/ Part4/ Part5.
現 연세대학교 정보산업공학과 석박통합과정
- 성균관대 통계학과 졸업
- 빅콘테스트 2018년 엔씨소프트상
- SK하이닉스 사외강사(2018/2019)
김강진 강사님
Part 1/ Part3
現 서울대학교 보건대확원 보건 통계학 석사
- Datamarket.kr 공동 창업자
- 빅콘테스트 2015년 미래창조과학부 장관상
- 연세대학교 주관 Bigdata x Yonsei 강의 강사

약 1,275분, 116개 실무 위주의 영상 강의 클립으로
실무에 활용되는 이론은 물론 실습까지!

현업에 꼭 필요한 내용만 모아 배웁니다.
실무자가 말하는 꼭 필요한 실무, 많은 강의 경험과 실무 경험을 바탕으로
입문자의 눈높이에서 가르치는 강사님들과 함께 파이썬 머신러닝을 제대로 배워보세요.


총 6개 파트로 구성된 체계적인 프로젝트성 커리큘럼.

Intro - 머신러닝 개요

머신러닝은 크게 지도학습과 비지도학습으로 나눌 수 있습니다. 머신러닝의 기본적인 개념을 학습하고 '입력변수(X)와 출력변수(Y)의 관계를 모델링하는 지도학습'과 '출력변수(Y) 없이 입력변수(X)끼리의 관계를 모델링하는 비지도학습'을 이해하고, 앞으로 배우게 될 머신러닝 주요 모형들(회귀분석~클러스터링)은 어떤 것들이 있는지 알아보며 기본적인 내용을 숙지합니다. 모형들에 대해 적합성을 평가하는 기준과 Overfitting(과적합)을 방지하기 위한 데이터 분할 방법을 이해하여 최적화&모델 성능을 어떻게 높일 수 있는 지 머신러닝의 전반적인 예측 실험 과정까지 앞으로 어떤 내용을 배우는지 전반적으로 사전에 확인해보는 단계입니다.

  • 주요 스킬셋
    ✔ 머신러닝이 무엇인지 이해
    ✔ 머신러닝의 가장 기본적인 개념인 지도학습과 비지도학습 구분
    ✔ Overfitting을 이해하고, 어떻게 해결할 수 있는지 설명

    강사: 이경택 감수자: 최윤진

Part1. 머신러닝을 위한 수학

머신러닝을 이해하기 위한 기본적인 통계학 방법론과 다양한 자료형들을 알아보고, 모집단부터 산포도, 정규분포 등 기초 통계를 이해하고 확률에 대해 배워봅니다. 이산형/연속형 확률분포부터 유의확률까지 기본적인 확률 개념을 숙지한 후 꼭 알아야 할 '미분'에 대해서 학습합니다. 이를 통해 머신러닝을 위해 반드시 필요한 Matrix 미분을 이해하게 되고, 행렬과 백터의 수학적인 개념을과 함께 Matrix 미분을 배웁니다.

  • 미니 Project ① 확률과 손실(비용)함수로 배우는 최적화

    머신러닝에서 이용되는 미분 개념과 통계 내용을 직접 문제 상황에 적용해 볼 예정입니다. 강의에서 배운 확률 이론을 통해 최대우도추정량과 불편추정량을 이해하고, 미분으로 회귀직선을 간단히 분석해봅니다. 또한 직접 파이썬 코딩을 통하여 최소제곱법의 개념을 구현하여 머신러닝의 핵심 개념인 ‘경사하강법'의 의미를 살펴봅니다.



    주요 스킬셋
    ✔ 확률변수와 MLE 이해
    ✔ 반응함수와 단순회귀모형 이해
    ✔ 편미분 개념과 경사하강법 이해

    강사: 김강진 감수자: 이정훈 출제자: 이정훈

Part2. 머신러닝의 시작, 회귀분석

앞서 배운 확률/통계/미분~ Matrix미분까지 활용하여 본격적으로 회귀분석을 학습합니다. 회귀분석을 통해 귀무가설/대립가설~ R Square와 같은 통계개념도 숙지하면서 머신러닝을 위한 회귀분석이 어떻게 코드로 구현되는지 알아봅니다. 또한 Multicollinearity(다중공선성)와 같은 문제현상을 알아보고 VIF 진단법을 학습합니다. 단순/ 다중회귀분석을 학습한 이후 binary 형태의 출력변수를 예측할 때 사용하는 기법인 로지스틱 회귀분석까지 배우는 단계입니다.

  • 미니 Project ② MLB 데이터를 활용한 회귀모델 생성 및 결과분석

    이번 파트에서 공부한 회귀분석을 MLB moneyball 데이터에 적용해보는 프로젝트입니다. 단순선형회귀분석과 여러 개의 독립변수를 사용하는 다중선형회귀분석의 결과를 비교할 예정입니다. 또한, VIF를 계산해서 다중공선성 문제를 확인할 것이며 종속변수를 잘 설명하는 최적의 독립변수를 찾는 것을 문제화하였습니다.




    주요 스킬셋
    ✔ 회귀분석 및 로지스틱회귀분석 모델 이해
    ✔ 데이터 시각화
    ✔ 변수선택법 & 최적화
    ✔ statsmodels 라이브러리 활용

    강사: 이경택 감수자: 김민중 출제자: 김민중

Part3. 머신러닝 기본모형

특정 환경에서 가질 수 있는 패턴이 두 가지 경우일 때 유용하게 사용할 수 있는 Naive Bayes 정규분포와 같이 규칙적인 분포를 띄지 않는 경우, margin(서로 다른 데이터셋을 나누는 범위)를 최대화하는 boundary를 찾는 SVM(Support Vector Machine), 각 변수들의 이분법 기준을 통해 샘플을 분류하고, 분류된 집단의 성질으로 종속변수를 추정하는 의사결정나무 까지 이 내용들을 수학적인 개념과 함께 코드로 구현해보는 실습도 해보면서 머신러닝을 더욱 탄탄하게 이해해보는 단계 입니다.

  • 미니 Project③ 가상데이터를 활용한 분류모델 생성 및 시각화

    머신러닝의 지도학습에는 크게 회귀 문제, 분류 문제가 있습니다. 이번 프로젝트에서는 분류 문제를 해결하는 대표적인 알고리즘 4가지(Naive Bayes, KNN, SVM, 의사결정나무)를 각각 구현해보고 시각화해봅니다. 이를 통해 이번 파트에서 학습한 내용을 토대로 더미(가상)데이터를 직접 다뤄보면서 결과를 예측하고 해석해볼 수 있습니다.



    주요 스킬셋
    ✔ Naive Bayes 이해/활용(예측)/시각화
    ✔ KNN, SVM 이해/활용(예측)/시각화
    ✔ Decision Tree 이해/활용(예측)/시각화



    강사: 김강진 감수자: 이준호 출제자: 이준호

Part 4. 앙상블

하나의 머신러닝 모델을 사용했을 때 과적합과 같은 문제가 자주 발생하는데, 이를 해결할 수 있는 강력하고 유용한 기법이 'Ensemble' 모델입니다. 여러가지 모델의 결과를 평균을 내서 모집단의 평균에 가깝게 만들어내는('대수의 법칙') Ensemble 모델에 대해 이해해보고 Tree 기반의 단일모델인 Bagging,RandomForest,Boosting 과 Regression을 사용하는 Stacking을 알아봅니다. 마지막으로 Feature importance를 파악하는 데에 도움을 주는 'shape value'까지 이해해보도록 합니다.

  • 미니 Project④ 앙상블 기법을 활용한 보스톤 주택 가격 예측 (Boston House Prices)

    앙상블 파트에서 배운 내용을 통해 보스톤 주택 가격과 관련된 데이터를 기반으로 주택 가격을 예측하게 됩니다. pandas, numpy, scikit-learn 패키지를 활용하여 데이터 가공, 전처리, 피처 엔지니어링을 진행하고 회귀문제를 다루는 머신러닝 앙상블 기법을 활용하여 보스톤 주택 가격을 예측합니다. 또한 Bagging, Boosting, Voting, Stacking 기법을 활용하여 앙상블 모델을 구현하고 구현된 각 모델의 성능을 비교해봅니다.



    주요 스킬셋
    ✔ pandas, numpy, sklearn 활용 데이터 가공/전처리/feature Engineering
    ✔ Ensemble모델 활용 가격예측
    ✔ Bagging, Boosting, Voting, Stacking 이해/활용
    ✔matplotlib, seaborn 활용 시각화



    강사: 이경택 감수자: 이경록 출제자: 이경록

Part5. 군집분석 & 불균형 데이터 다루기

'비지도학습'을 대표하는 군집분석(Clurstering)을 배워봅니다. 군집분석은 유사데이터간 분류하고 특성을 찾아내는 기법으로, 크게 K-means/Hierarchical/DBSCAN Clustering 세 가지 모두 배워보면서 실습을 통해 확실하게 개념을 다져보도록 합니다. 또한 머신러닝을 다루면서 자주 겪게 되는 불균형 데이터 문제를 미리 학습해봅니다. 다루는 기법은 크게 Oversampling/Undersampling/Hybrid resampling 세 가지로 각각 알아보고 문제 해결역량까지 배워보게 됩니다.

  • 미니 Project⑤ 숫자손글씨(MNIST) 데이터 클러스터링

    클러스터링 파트에서는 수치 및 텍스트에 대한 여러가지 클러스터링 기법에 대해서 배워봤습니다. 이번 프로젝트에서는 이미지에 대해서 배운 클러스터링 기법을 활용해보도록 하겠습니다. 데이터는 인공지능 입문에서 가장 많이 사용되고 있는 숫자손글씨인 MNIST에 대해서 다뤄보도록 하겠습니다.



    주요 스킬셋
    ✔ 클러스터링 기법을 활용해 숫자손글씨 데이터를 동일한 숫자끼리 모으기
    ✔ 비지도학습을 이해하고, 대표 기법인 Clustering 코드로 구현
    ✔K-means/Hierarchical/DBSCAN Clustering 세 가지 기법 이해 및 활용



    강사: 이경택 감수자: 김태영 출제자: 김태영

  • 미니 Project⑥ IEEE-CIS Fraud Detection의 불균형 데이터 다루기

    실제 캐글에서 개최된 부정거래 예측 대회인 IEEE-CIS Fraud Detection에서 사용된 데이터를 가지고 불균형 데이터 분석을 수행해보고, 간단한 예측 모델을 만들어보겠습니다. 예측 모델의 정확도를 높이기 위해서 본 파트에서 배운 여러가지 불균형 데이터 처리 기법을 적용해보고 그 결과를 살펴보겠습니다.



    주요 스킬셋
    ✔Oversampling/Undersampling/Hybrid resampling 기법 이해 및 활용
    ✔부정거래 예측 데이터(IEEE-CIS Fraud Detection)로 불균형 데이터 분석을 수행 및 예측모델 만들기



    강사: 이경택 감수자: 김태영 출제자: 김태영

최종 프로젝트

  • 최종 Project① 대출 상환 예측(Home Credit Default Risk)

    많은 사람들은 신용 기록이 불충분하거나 존재하지 않아 대출을 받기 위해 애를 씁니다. 주택 신용 기관(Home Credit)은 안전한 차용을 제공하고자 고객의 상환 능력을 미리 예측할 필요가 있고, 이를 위해 전화 및 거래 정보를 포함한 다양한 데이터를 사용하고 있습니다. 여러분들은 지금까지 배운 다양한 통계 분석 기법과 머신러닝 모델을 활용하여 고객의 부채 상환 능력에 대해 예측을 진행하게 됩니다.



    주요 스킬셋
    ✔pandas, numpy, scikit-learn
    ✔ 데이터 병합, 전처리, 시각화
    ✔ 머신러닝 모델링 및 예측
    ✔ 평가



    출제자 : 이경록

  • 최종 Project② 집값예측-심화(House Prices: Advanced Regression Techniques)

    많은 사람들이 원하는 집의 조건은 무엇일까요? 집을 묘사할 수 있는 데이터는 무수히 많습니다. 집의 천장 높이가 될 수도 있고 각종 구조물일 수도 있겠습니다. 본 프로젝트에서는 79개의 다양한 ‘집’ 관련 데이터를 기반으로, 사람들이 원하는 집을 상상해보고 이를 통해 최종 집값을 예측하게 됩니다. 데이터의 이상치, 결측치를 처리해보는 것은 물론, 회귀분석부터 다양한 모델들의 고급 머신러닝 기법, 앙상블 학습까지 전 범위의 내용을 통합하여 모델의 성능을 끌어올려봅니다.



    주요 스킬셋
    ✔eature engineering
    ✔데이터 병합, 전처리, 시각화
    ✔회귀 모델 & 고급 머신러닝 예측
    ✔앙상블
    ✔평가

    출제자 : 이경록

원활한 수강을 위해, 선수지식을 꼭 확인하세요!

  • Python 기초 문법 지식

    모든 강의는 파이썬 코드와 함께 병행하여 진행되어, 파이썬 기초 문법에 대한 설명은 이 강의에 포함되어 있지 않습니다.
    파이썬 for, list, array, function 각 문법에 대해 쉽게 이해할 수 있는 정도면 본 과정을 수강할 수 있습니다.

잠깐! 본 과정이 나에게는 너무 어려운가요?

탄탄한 파이썬 문법 기초가 필요한 분들을 위해
Data Science with Python 바이트 디그리 코스를 준비했습니다.
전문 강사진이 감수한 프리미엄 커리큘럼으로
필수 파이썬 기초 문법 지식 다져보세요!

국내 데이터 분석 전문가들이 참여한
바이트 디그리만의 체계적인 감수 System.

개념, 필수수학, 머신러닝 모델, 프로젝트를 통해 실제로 구현하기까지 업무에 적용할 수있는
머신러닝 핵심만을 담았는지 철저하게 검토했습니다.

통합 감수자는 누구인가요?
바이트 디그리의 전체 커리큘럼과 프로젝트를 감수하는 역할입니다. 모든 교육 과정이 실무에 필요한 내용으로만 이루어졌는지 철저하게 검토합니다.

파트 감수자는 누구인가요?
각 커리큘럼 파트가 실무에 적합한 내용과 프로젝트로 구성되었는지 감수하는 역할입니다. 더불어, 파트별 실습 프로젝트 설계와 학습 단계별 프로젝트 출제 및 해설지 제공을 진행합니다.

실무 능력을 성장시키는 1:1 Care .

바이트 디그리는 현직자들이 1:1로 코칭해줍니다.
끝까지 당신이 공부할 수있도록 만나지 않고도 만난 것 처럼 끊임 없는 피드백을 해드립니다.

바이트 디그리 인증서는
3가지 조건을 모두 충족 한 수강생에게만 발급됩니다.

바이트 디그리 수강생을 위한 8가지 특별 구성

블록체인 기술을 활용한 인증서 발급

위변조가 불가능한 블록체인 기술로 유일무이한 나만의 실무 자격 인증서와 시리얼 넘버가 생성됩니다.
발급받은 바이트 디그리 인증서는 인쇄가 가능하며 웹사이트 상에서 영구 보관되어 언제든 필요할 때 여러분의 실무 자격 인증서를 꺼내볼 수 있습니다.

전 세계가 주목하는 온라인 실무 인증 과정

해외에서는 이미 활성화 되고 있는 온라인 직무 능력 인증 과정. 온라인으로 필요한 실무 능력을 단기간에 학습하고 검증합니다. 시간이 흐를수록 더 많은 교육 기관들이 동참하고 있으며, 기업들도 실무 능력을 검증할 수 있는 인증서를 요구하는 추세입니다.
(*출처: http://www.bloter.net/archives/236871)

머신러닝 실무 스킬 학습을 위한 국내 유일 프로그램 Byte Degree.

빠른 머신러닝 실력 향상, 이제 Byte Degree로 시작하세요.

머신러닝 바이트 디그리
자세한 프로그램 구성을 확인해보세요.

머신러닝 바이트 디그리 FAQ.