5% 할인 행사 중(~04/25)

파이썬을 활용한

머신러닝
CAMP

머신러닝 학습에 코딩만이 능사는 아닙니다.
머신러닝의 총체적 이해를 돕는 입문자용 강의!

#머신러닝입문#체계적_이해
#핵심알고리즘

기간 & 일정

2019.4.27. – 6.22.
매주 토요일 10:00-13:00
주 1회, 총 27시간
*5/4 어린이날 연휴 휴강

장소 & 준비물

패스트캠퍼스 강남강의장
개인노트북

담당자 & 문의

이샘 매니저
02-518-4822
help_ds@fastcampus.co.kr

머신러닝
배우시게요?

이런 여러분을 위해
준비했습니다.

인공지능에 관심있는
비전공자


머신러닝은 통계학에서 쓰는 몇 백 가지의 방법론들을 조합해서 나온 방대한 학문입니다. 때문에 이제 막 머신러닝에 관심을 갖기 시작하셨다면, 굳이 석학들이 머리 쥐어짜며 연구하는 어려운 분야부터 시작할 필요는 없습니다. 이 강의로 머신러닝의 기본을 천천히 다져가면서 시작해 보세요. 이 강의는 이후 당신의 머신러닝 연구에 최적의 멘토가 될 것입니다!

머신러닝 독학에
어려움을 겪는 자


딥러닝이 어떻고, 신경망 모델이 어떻고…도무지 이해할 수 없는 말 뿐인 학습자료들. 꾸역꾸역 이해하며 진도를 빼더라도 결국 돌아서니 남는 게 없는 학습 경험에 당황한 적이 있으신가요? 이 강의로 모델이 어떻게 만들어지고 변형되는지 이해할 수 있는 수식/알고리즘 등 배경 지식에 대한 학습부터 시작해보세요. 원리를 이해하면 여러분의 학습에도 속도가 붙게 될겁니다.

빅데이터가 부상하면서,
우리는 이미 여러 영역에서 머신러닝의 도움을 받고 있습니다.

계산 금융
신용 평가 및 알고리즘 트레이딩

이미지 프로세싱 및 컴퓨터 비전
얼굴 인식, 동작 인식, 객체 인식

자동차, 항공 및 제조
예측 기반 유지 보수 시스템 개발

계산 생명공학
종양감지, 신약 발견, DNA 염기 서열(DNA Sequence)

에너지 생산
가격 및 부하 예측

자연어 처리

그렇다면, 머신러닝이란 무엇일까요?

머신러닝이란 사람과 동물의 자연스러운 경험을 통한 학습을 컴퓨터가 수행할 수 있도록 가르치는 것입니다. 맞춤 코드작성이나 수학/프로그래밍 고도지식 없이도 프로그램을 활용해 머신러닝을 학습시키고 최적의 파라미터를 찾아낼 수 있습니다.

파이썬으로도 머신러닝 시작할 수 있습니다!

알고리즘 성능 향상을 위해 컴퓨터에게 학습시킬 데이터를 늘리려면 반복적인 데이터 처리 작업을 빠르고 손쉽게 조작할 수 있는 도구가 필요합니다. 파이썬은 이 조건에 바로 부합하면서도, 범용 프로그래밍 언어의 장점과  MATLAB이나 R 같은 특정 분야를 위한 스크립팅 언어의 편리함까지 갖추고 있기 때문에 기존 파이썬 사용자라면 부담없이 시작할 수 있습니다.

개와 고양이 구별 사례로 보는
머신러닝의 이해  

당신이 만들어 갈 영역에 힘을 보태 줄
이 강의만의 특징

1

 

머신러닝 모델을 이해하는
직관을 기릅니다

전체 흐름을 이해하는 것은 머신러닝 입문 학습에 가장 중요한 요소입니다. 본 강의에서는 전문용어의 사용을 배제하고, 알고리즘 이해를 위한 최소한의 수학적 지식만을 통해 머신러닝 알고리즘이 어떤 것이고 어떻게 활용되는지를 보여드릴 것입니다. 살아있는 Kaggle 데이터를 활용해 실사용례를 확인하는 것도 큰 도움이 될 것입니다.

2

 

Step-by-step으로
방대한 학습량에 접근합니다

머신러닝은 학습량이 방대하기 때문에 스텝 바이 스텝으로 이론 학습과 실습을 병행해야 합니다. 학창시절 집합 배우고 집합 예제 풀고, 함수 배우고 함수 예제를 풀었던 것처럼 말입니다. 이 강의 역시 이론-실습, 이론-실습을 병행하는 커리큘럼으로 여러분이 실력을 차근차근 쌓아나갈 수 있게 구성되어 있습니다. 수업 후 제공되는 퀴즈 및 여러 실습 과제 역시 학습에 도움이 될 것입니다.

3

 

흥미로운 예제를 통해
학습효과를 극대화합니다

따분한 수식과 논문 내용만으로는 학습효과를 기대하기 어렵습니다. 이 강의에서는 ‘타이타닉 탑승객의 분류’, ‘코비 브라이언트의 슛 성공/실패 분류’, ‘목소리 신호 데이터로 성별 분류’ 등과 같이 수강생의 흥미를 이끌어 낼 예제를 통해 강의 내용의 장기기억을 도모합니다.

4

 

입문자의 눈높이에 맞춘
맞춤형 강의를 만듭니다

입문자를 위한 강의는 해당 분야에 대해 오랫동안 고민한 강사님이 아니라면 만들기 어렵습니다. 다양한 기관/기업체와의 연구 경험을 통해 심도 있는 인사이트를 갖춘 강사님이, 입문자가 어려워할 만한 포인트를 쏙쏙 짚어 전수해 드립니다.

수강신청 전 확인해야 할
CHECK-LIST

1. 파이썬으로 코드를 돌려본 경험이 있다.
2. 파이썬 스크립트를 보고 코드의 의미를 어느 정도 파악할 수 있다.
3. 파이썬 라이브러리를 활용해 본 경험이 있다.


*위의 Check List 3가지 중 2가지 이상 해당 되는 분들은 본 강의를 수강하셔도 좋습니다.
만약 2가지 이상 해당되지 않는다면 반드시 사전에 담당 매니저와 상의한 후 신청해 주세요.

머신러닝 입문자를 위한
맞춤형 커리큘럼

주차
내용
1주차
머신러닝 개요 및 파이썬 실습
이론
- 머신러닝에 대한 소개와 이의 활용사례 및 이슈를 소개합니다.
- 수업 실습을 위한 파이썬 환경 구성을 하고, 데이터 핸들링을 위한 파이썬 패키지들을 사용해봅니다.

※ 참고: 파이썬 환경은 Anaconda 4.4.0 (Python v3.6) 으로 구성할 예정입니다.
실습
- 머신러닝의 개념과 우리가 이를 통해 실제 비즈니스 문제, 데이터마이닝 문제. 인공지능 문제를 어떻게 해결할 수 있는지에 대해 소개
- 데이터 핸들링을 위해 필수적으로 알아야 하는 Python 패키지인 Numpy, Pandas, Matplotlib 실습
- Python의 머신러닝 패키지인 scikit-learn에 대한 소개, scikit-learn을 활용한 데이터 전처리 실습
2주차
선형회귀모델과 이의 확장 모델들
이론
- 회귀모델은 중고차 가격, 주가지수, 수요 등 수치형의 값을 예측하는 용도로 사용하는 모델입니다.
- 이 파트에서는 회귀모델 중 가장 기본이 되는 선형회귀모델 (linear regression) 에 대해 살펴보고, 이의 확장 모델들을 다룹니다.

-­ 머신러닝 알고리즘의 주요 개념인 손실함수 (Loss function), 파라미터 (Parameter) 및 하이퍼파라미터 (Hyperparameter) 에 대해 다룹니다.
실습
- 자전거 수요 예측을 위한 회귀모델
[Bike sharing demand]: https://www.kaggle.com/c/bike-sharing-demand
   * ­다중선형회귀모델 (Multiple linear regression) 에 대한 소개 및 학습 알고리즘
   * ­제약된 선형회귀모델로 널리 이용되는 Ridge, Lasso
   * ­다항회귀모델 (Polynomial regression)
3주차
로지스틱회귀모델과 분류 모델의 평가
이론
­- 분류모델은 회귀모델과는 다르게 범주를 분류하는 것을 목적으로 하며, 제품 품질상태 분류, 문서 카테고리 태깅, 물체 인식 등 다양한 도메인에서 활용되는 모델입니다.
- ­로지스틱회귀모델은 여러 분야에서 널리 사용하는 분류모델 중 하나로, 인공신경망, 딥러닝과도 밀접한 관련이 있는 모델입니다.
실습
- 타이타닉 탑승객의 분류
[Titanic: Machine learning from disaster]: https://www.kaggle.com/c/titanic
   * 다중로지스틱회귀모델 (Multiple logistic regression) 에 대한 소개 및 학습 알고리즘
   * 분류모델의 평가: 혼동행렬 (confusion matrix) 기반 분류모델 평가지표들, ROC curve 등.
4주차
k-최인접이웃 분류/회귀모델과 나이브 베이즈 분류기
이론 - ­­학습과정이 필요없는 k-최인접이웃(k-nearest neighbor) 분류/회귀모델과, 스팸 분류에서 좋은 성능을 보인 것으로 알려진 나이브 베이즈 분류모델(naive Bayes classifier)에 대하여 배웁니다.
-의사결정나무는 가장 직관적인 분류/회귀모델 중 하나입니다. 또한 (딥러닝과 더불어) 널리 사용되고 있는 랜덤포레스트, 부스팅 모델의 기본이 되는 모델입니다.
- 예측 모델링과 머신러닝 모델 튜닝을 위한 학습 셋 / 검증(개발) 셋 / 테스트 셋 분리를 이해합니다.
실습 - 타이타닉 탑승객의 분류
[Titanic: Machine learning from disaster]: https://www.kaggle.com/c/titanic
   * 다중로지스틱회귀모델 (Multiple logistic regression) 에 대한 소개 및 학습 알고리즘
   * 분류모델의 평가: 혼동행렬 (confusion matrix) 기반 분류모델 평가지표들, ROC curve 등.
5주차
편향-분산 트레이드오프와 과적합, 랜덤포레스트
이론
- 의사결정나무는 가장 직관적인 분류모델인 동시에 현재 머신러닝 분야에서 딥 러닝과 더불어 널리 사용되고 있는 나무기반모델들(랜덤포레스트와 부스팅모델)의 기본이 되는 모델입니다.
- ­다수의 랜덤의사결정나무를 혼합하여 생성되는 랜덤포레스트(Random forest) 모델에 대해 이해합니다.
- 실제 머신러닝 모델을 활용할 때에는, 이 모델이 앞으로 새롭게 등장하는 데이터에 대해서도 좋은 성능을 유지하느냐가 매우 중요합니다. 이와 관련된, 머신러닝에서 매우 중요한 이론인 편향-분산 트레이드오프(Bias-variance tradeoff)에 대해 이해하고, 모델의 적합도에 대해 이해합니다.
1차 Hands-on 실습 :­ 5주차까지 배운 내용을 바탕으로 Hands-on 실습을 진행합니다. 강사와 조교가 한 분씩 모델링 실습을 도와드리게 됩니다.
- NBA의 전설 코비 브라이언트의 슛 성공/실패 분류
[Kobe Bryant Shot Selection]:https://www.kaggle.com/xvivancos/kobe-bryant-shot-selection
   *랜덤포레스트에 대한 소개 및 학습 알고리즘
   *편향-분산 트레이드오프
6주차
인공신경망 및 딥러닝 개요
이론 - 피드포워드 네트워크 (Feed-forward network)는 가장 기본적인 인공신경망 모델 중 하나입니다. 피드포워드 네트워크 구조에 대해 이해하고 이의 학습하는 데에 필요한 경사하강법 (gradient descent) 과 역전파 (backpropagation) 방법에 대해 이해합니다.
- ­이를 기반으로 딥러닝 모델들을 간단하게 소개할 예정입니다.
실습 - 목소리 신호 데이터로 남/여 분류
[Gender Recognition by Voice]:https://www.kaggle.com/primaryobjects/voicegender
   * 피드포워드 네트워크 (Feed-forward network) 에 대한 소개
   * 인공신경망 학습을 위한 경사하강법과 역전파 방법
   * 딥 러닝 모델들에 대한 간단한 소개
7주차
SVM(Support Vector Machine), 교차 검증과 모델 튜닝
이론 - 서포트 벡터 머신 (Support vector machine: SVM) 은 딥 러닝 이전에 가장 많이 연구된 모델 중 하나로, 많은 데이터에서 좋은 성능이 나온 것으로 알려져 있습니다.
- 교차 검증 (cross-validation) 은 머신러닝 모델을 학습하는 전략 중 가장 많이 이용되는 방법입니다. 교차 검증은 모델의 (하이퍼)파라미터 튜닝에 유용하며, 모델의 편향성과 분산성을 확인할 수 있는 방법입니다.
2차 Hands-on 실습 :­ 7주차까지 배운 내용을 바탕으로 하나의 데이터에 여러 개의 분류모델을 학습하고 이들의 하이퍼파라미터를 튜닝하는 프로젝트를 Hands-on 실습으로 진행합니다.
- 과거 사용한 데이터로 다양한 모델링 실습 진행
* 선형 SVM과 커널 SVM에 대한 소개 및 학습
* 교차 검증과 모델 (하이퍼)파라미터 튜닝 전략
8주차
변수 엔지니어링과 군집모델
이론
- 군집모델(Clustering model)은 이 커리큘럼에서 유일하게 배우는 비지도학습 모델입니다. 군집모델은 데이터의 이해를 높이는 데에 유용하며, 마케팅 등 다양한 영역에서 활용 가능한 방법입니다.
- 서포트 벡터 머신 (Support vector machine: SVM) 은 딥 러닝 이전에 가장 많이 연구된 모델 중 하나로, 많은 데이터에서 좋은 성능이 나온 것으로 알려져 있습니다.
실습
- 음식 영양정보
[Open Food FactsExplore - nutrition facts from foods around the world]: https://www.kaggle.com/openfoodfacts/world-food-facts
* 변수 엔지니어링 방법들 소개: 변수 변환, 변수 부분집합 선택, 변수 추출
* 주성분분석 (Principal component analysis: PCA) 와 특이값분해 (Singular value decomposition: SVD), t-SNE
* k-means clustering, hierarchical clustering
9주차
앙상블과 Boosting Tree Model
이론
- 나의 문제를 굳이 하나의 모델로 풀 필요가 있을까요? 앙상블 (ensemble) 은 여러 모델을 이용하여 좀 더 좋은 결과를 이끌어내는 방법입니다. 현재 앙상블은 여러 머신러닝 competition 대회에서 널리 이용되고 있습니다.
- 이를 기반으로 현재 Kaggle에서 가장 널리 사용되는 모델인 부스팅모델을 소개합니다.
실습
- 유방암 진단 [Breast Cancer Wisconsin (Diagnostic) Data SetPredict whether the cancer is benign or malignant]:https://www.kaggle.com/uciml/breast-cancer-wisconsin-data
   * 앙상블 전략: Voting, Bagging, Boosting, Stacking
border_1

미리 알아두면 좋은 선수지식

파이썬 선수 학습을 위한 무료 강좌를 안내해 드립니다.

추천강의

수강신청 전 잠깐! 이 수업에는 Python 기초 문법에 대한 사전 지식이 필요합니다. Codeacademy의 Python 과정을 확인하시고, 해당 강좌에서 다루는 내용을 숙지한 이후 본 과정을 수강해 주세요.

수업 전, 머신러닝 사전학습에 도움되는 자료를 안내해 드립니다.


추천교재

밑바닥부터 시작하는 데이터과학

이제 막 머신러닝 학습을 시작하려고 하거나 머신러닝을 혼자 공부하면서 어려움을 겪고 계시다면 도서 밑바닥부터 시작하는 데이터과학 – 데이터 분석을 위한 파이썬 프로그래밍과 수학통계 기초를 미리 읽어보세요. 데이터 과학에 필요한 파이썬 프로그래밍과 데이터 과학분야에서 꼭 알아야 할 개념에 대한 내용이 담겨 있어 수업 이해에 많은 도움이 되실 겁니다.

border_1

실습 예시

Oops.. window is too small!

[ 남/여의 목소리 데이터를 활용한 의사결정 나무 모델링 ]

border_1

수강생 후기

이미지를 클릭하면 더 생생한 수강후기를 확인할 수 있습니다.

4기수강생

오승열 님

  

머신러닝 시작이 겁난다고요?  
고민 마시고 수강하세요

9기수강생

장정원 님

다양한 모델원리의 이해가 필요한
입문자들에게 도움이 됩니다

강사님의 머신러닝 관련지식과 연구 경험이 풍부하셔서 많은 도움이 됩니다.
대학원생 J님

강의 만족도 97%

강사님의 머신러닝 실력과 강의실력에 감동, 또 감동!
대학원생 P님

강의 만족도 100%

실제 사용법을 확실히 이해하게 됐어요, 혼자 공부할 때에 비해 훨씬 쉽게! 
H사 해외영업팀 N님

강의 만족도 98%

머신러닝 입문 강의로는 아주 잘 짜여진 커리큘럼이라고 생각합니다
T사 개발자 L님

강의 만족도 100%

수식으로 원리를 이해하고 모델링에 필요한 코드까지 꼼꼼히 챙겨주십니다
B사 데이터 분석가 Y님

강의 만족도 100%

기초적인 개념만 알아도 실무 적용가능한 방법을 배울 수 있습니다
A사 모바일웹 개발자 K님

강의 만족도 96%
border_1

성공적인 머신러닝 입문을 도울
현업 전문가 강사님

고태훈 강사님
서울대병원 연구조교수, 서울대 산업공학과 데이터마이닝센터 박사

실제 비즈니스에서 적용 가능한 데이터마이닝 프로세스, 그리고 이에 적용 가능한 기법을 찾아서 연결하는 에플리케이션에 대한 연구에 많은 관심을 가지고 있습니다. 그동안은 주로 삼성전자, LG전자, 현대자동차, 현대중공업, 두산인프라코어 등 제조업 분야의 기업체들과 연구 과제를 진행했으며, 그 밖에도 현대카드나 ssg.com, 서울대병원 등 기관/기업체과도 함께 일하면서 연구 범위를 다양화해 왔습니다. 현재는 머신러닝과 딥러닝, 자연어처리와 텍스트마이닝 등에 대한 연구를 이어가는 중입니다.

강사님 인터뷰 보러가기