파이썬을 활용한
머신러닝 CAMP.

머신러닝 구현을 위한 핵심 알고리즘에 맞춘 #데이터 전처리 #결과 해석 #적용까지 !

기 간 일 정 장 소 준비물 문 의
1월 7일 ~ 3월 18일
(주 1회, 총 9주)
휴강 : 2/4 설연휴, 2/11 강사님 학회일정
월요일 오후 7시 30분
~ 10시 30분
(회 당 3시간, 총 27시간)
패스트캠퍼스 강남 강의장 개인 노트북 권장 이샘 매니저
tel. 02-518-4822
| help-ds@fastcampus.co.kr

머신러닝은 처음이신가요?

기초 이론 및 실습 + 알고리즘 이해 + 실무 이해
이 모든 것을 담은 9주 커리큘럼으로 머신러닝을 시작해보세요!

개와 고양이 구별 사례를 통한 머신러닝의 이해.

icon_woman4_2_happy

머신러닝(Machine Learning)은 사람과 동물에게 자연스러운 ‘경험’을 통한 학습을 컴퓨터가 수행할 수 있도록 가르치는 것을 말합니다. 머신러닝 알고리즘은 맞춤 코드(Custom Code)를 작성하지 않고도 계산 방법을 사용하여 데이터에서 직접 정보를 학습합니다. 학습할 수 있는 데이터가 증가함에 따라 알고리즘 성능이 적절하게 향상됩니다.

실제 응용 분야는?

빅데이터가 부상하면서 머신러닝은 다음과 같은 영역에서 문제를 해결하는데 응용되고 있습니다.

계산 금융
신용 평가 및 알고리즘 트레이딩

이미지 프로세싱 및 컴퓨터 비전
얼굴 인식, 동작 인식, 객체 인식

자동차, 항공 및 제조
예측 기반 유지 보수 시스템 개발

계산 생명공학
종양감지, 신약 발견, DNA 염기 서열(DNA Sequence)

에너지 생산
가격 및 부하 예측

자연어 처리

머신러닝 실력을 탄탄하게 다져 줄 강의 특징.

1

기초 개념부터 차근차근히

머신러닝을 위해 반드시 알아야 할 기초 개념부터, 핵심 알고리즘의 원리와 기능에 대해 온전히 이해할 수 있도록 수강생의 눈높이에 맞춰 차근차근 가르쳐 드립니다.

2

수학도 부담없이

해당 알고리즘을 이해하기 위한 최소한의 수학적인 내용만을 압축하여 전달해드리므로 수학에 대한 부담감이 덜합니다.

3

다양한 실습으로 실전 역량 강화

총 7번의 알고리즘 적용 실습을 진행합니다. 실습마다 잘 다듬어진 파이썬 내장 데이터가 아니라 Kaggle 데이터를 활용하여 이를 통해 혼자서도 알고리즘을 구현할 수 있는 실전 역량을 길러드립니다.

4

결과 해석 실습으로 활용력 향상

분석 결과에서 유의미한 수치값이 무엇인지 제대로 해석하고, 결과에 따라 알고리즘을 목적에 맞게 활용할 수 있도록 실력있는 조교가 항상 옆에서 도와드립니다.

이런 분들께 추천합니다.

icon_man3_2_happy

자신의 연구에 데이터 분석을 활용하고 싶은 연구원 및 대학원생

icon_man2_2_happy

머신러닝 알고리즘을 이해하고 업무에 적용하고 싶은 개발자

icon_woman1_2_happy

머신러닝이 무엇이고, 어떻게 활용되는 건지 알고 싶은 파이썬 초보자

수강 전 CHECK LIST.

1. 파이썬으로 코드를 돌려본 경험이 있다.
2. 파이썬 스크립트를 보고 코드의 의미를 어느 정도 파악할 수 있다.
3. 파이썬 라이브러리를 활용해 본 경험이 있다.

*위의 Check List 3가지 중 2가지 이상 해당 되는 분들은 본 강의를 수강하셔도 좋습니다.
위 경우 중 2가지 이상 해당되지 않는 분들은 사전에 반드시 담당 매니저와 상의한 후 신청해 주시기 바랍니다.

머신러닝 입문자를 위한 맞춤형 커리큘럼.

주차
내용
1주차
머신러닝 개요 및 파이썬 실습
이론
- 머신러닝에 대한 소개와 이의 활용사례 및 이슈를 소개합니다.
- 수업 실습을 위한 파이썬 환경 구성을 하고, 데이터 핸들링을 위한 파이썬 패키지들을 사용해봅니다.

※ 참고: 파이썬 환경은 Anaconda 4.4.0 (Python v3.6) 으로 구성할 예정입니다.
실습
- 머신러닝의 개념과 우리가 이를 통해 실제 비즈니스 문제, 데이터마이닝 문제. 인공지능 문제를 어떻게 해결할 수 있는지에 대해 소개
- 데이터 핸들링을 위해 필수적으로 알아야 하는 Python 패키지인 Numpy, Pandas, Matplotlib 실습
- Python의 머신러닝 패키지인 scikit-learn에 대한 소개, scikit-learn을 활용한 데이터 전처리 실습
2주차
선형회귀모델과 이의 확장 모델들
이론
- 회귀모델은 중고차 가격, 주가지수, 수요 등 수치형의 값을 예측하는 용도로 사용하는 모델입니다.
- 이 파트에서는 회귀모델 중 가장 기본이 되는 선형회귀모델 (linear regression) 에 대해 살펴보고, 이의 확장 모델들을 다룹니다.

-­ 머신러닝 알고리즘의 주요 개념인 손실함수 (Loss function), 파라미터 (Parameter) 및 하이퍼파라미터 (Hyperparameter) 에 대해 다룹니다.
실습
- 자전거 수요 예측을 위한 회귀모델
[Bike sharing demand]: https://www.kaggle.com/c/bike-sharing-demand
   * ­다중선형회귀모델 (Multiple linear regression) 에 대한 소개 및 학습 알고리즘
   * ­제약된 선형회귀모델로 널리 이용되는 Ridge, Lasso
   * ­다항회귀모델 (Polynomial regression)
3주차
로지스틱회귀모델과 분류 모델의 평가
이론
­- 분류모델은 회귀모델과는 다르게 범주를 분류하는 것을 목적으로 하며, 제품 품질상태 분류, 문서 카테고리 태깅, 물체 인식 등 다양한 도메인에서 활용되는 모델입니다.
- ­로지스틱회귀모델은 여러 분야에서 널리 사용하는 분류모델 중 하나로, 인공신경망, 딥러닝과도 밀접한 관련이 있는 모델입니다.
실습
- 타이타닉 탑승객의 분류
[Titanic: Machine learning from disaster]: https://www.kaggle.com/c/titanic
   * 다중로지스틱회귀모델 (Multiple logistic regression) 에 대한 소개 및 학습 알고리즘
   * 분류모델의 평가: 혼동행렬 (confusion matrix) 기반 분류모델 평가지표들, ROC curve 등.
4주차
k-최인접이웃 분류/회귀모델과 나이브 베이즈 분류기
이론 - ­­학습과정이 필요없는 k-최인접이웃(k-nearest neighbor) 분류/회귀모델과, 스팸 분류에서 좋은 성능을 보인 것으로 알려진 나이브 베이즈 분류모델(naive Bayes classifier)에 대하여 배웁니다.
-의사결정나무는 가장 직관적인 분류/회귀모델 중 하나입니다. 또한 (딥러닝과 더불어) 널리 사용되고 있는 랜덤포레스트, 부스팅 모델의 기본이 되는 모델입니다.
- 예측 모델링과 머신러닝 모델 튜닝을 위한 학습 셋 / 검증(개발) 셋 / 테스트 셋 분리를 이해합니다.
실습 - 타이타닉 탑승객의 분류
[Titanic: Machine learning from disaster]: https://www.kaggle.com/c/titanic
   * 다중로지스틱회귀모델 (Multiple logistic regression) 에 대한 소개 및 학습 알고리즘
   * 분류모델의 평가: 혼동행렬 (confusion matrix) 기반 분류모델 평가지표들, ROC curve 등.
5주차
편향-분산 트레이드오프와 과적합, 랜덤포레스트
이론
- 의사결정나무는 가장 직관적인 분류모델인 동시에 현재 머신러닝 분야에서 딥 러닝과 더불어 널리 사용되고 있는 나무기반모델들(랜덤포레스트와 부스팅모델)의 기본이 되는 모델입니다.
- ­다수의 랜덤의사결정나무를 혼합하여 생성되는 랜덤포레스트(Random forest) 모델에 대해 이해합니다.
- 실제 머신러닝 모델을 활용할 때에는, 이 모델이 앞으로 새롭게 등장하는 데이터에 대해서도 좋은 성능을 유지하느냐가 매우 중요합니다. 이와 관련된, 머신러닝에서 매우 중요한 이론인 편향-분산 트레이드오프(Bias-variance tradeoff)에 대해 이해하고, 모델의 적합도에 대해 이해합니다.
1차 Hands-on 실습 :­ 5주차까지 배운 내용을 바탕으로 Hands-on 실습을 진행합니다. 강사와 조교가 한 분씩 모델링 실습을 도와드리게 됩니다.
- NBA의 전설 코비 브라이언트의 슛 성공/실패 분류
[Kobe Bryant Shot Selection]:https://www.kaggle.com/xvivancos/kobe-bryant-shot-selection
   *랜덤포레스트에 대한 소개 및 학습 알고리즘
   *편향-분산 트레이드오프
6주차
인공신경망 및 딥러닝 개요
이론 - 피드포워드 네트워크 (Feed-forward network) 는 가장 기본적인 인공신경망 모델 중 하나입니다. 피드포워드 네트워크 구조에 대해 이해하고 이의 학습하는 데에 필요한 경사하강법 (gradient descent) 과 역전파 (backpropagation) 방법에 대해 이해합니다.
- ­이를 기반으로 딥러닝 모델들을 간단하게 소개할 예정입니다.
실습 - 목소리 신호 데이터로 남/여 분류
[Gender Recognition by Voice]:https://www.kaggle.com/primaryobjects/voicegender
   * 피드포워드 네트워크 (Feed-forward network) 에 대한 소개
   * 인공신경망 학습을 위한 경사하강법과 역전파 방법
   * 딥 러닝 모델들에 대한 간단한 소개
7주차
SVM(Support Vector Machine), 교차 검증과 모델 튜닝
이론 - 서포트 벡터 머신 (Support vector machine: SVM) 은 딥 러닝 이전에 가장 많이 연구된 모델 중 하나로, 많은 데이터에서 좋은 성능이 나온 것으로 알려져 있습니다.
- 교차 검증 (cross-validation) 은 머신러닝 모델을 학습하는 전략 중 가장 많이 이용되는 방법입니다. 교차 검증은 모델의 (하이퍼)파라미터 튜닝에 유용하며, 모델의 편향성과 분산성을 확인할 수 있는 방법입니다.
2차 Hands-on 실습 :­ 7주차까지 배운 내용을 바탕으로 하나의 데이터에 여러 개의 분류모델을 학습하고 이들의 하이퍼파라미터를 튜닝하는 프로젝트를 Hands-on 실습으로 진행합니다.
- 과거 사용한 데이터로 다양한 모델링 실습 진행
* 선형 SVM과 커널 SVM에 대한 소개 및 학습
* 교차 검증과 모델 (하이퍼)파라미터 튜닝 전략
8주차
변수 엔지니어링과 군집모델
이론
- 군집모델(Clustering model)은 이 커리큘럼에서 유일하게 배우는 비지도학습 모델입니다. 군집모델은 데이터의 이해를 높이는 데에 유용하며, 마케팅 등 다양한 영역에서 활용 가능한 방법입니다.
- 서포트 벡터 머신 (Support vector machine: SVM) 은 딥 러닝 이전에 가장 많이 연구된 모델 중 하나로, 많은 데이터에서 좋은 성능이 나온 것으로 알려져 있습니다.
실습
- 음식 영양정보
[Open Food FactsExplore - nutrition facts from foods around the world]: https://www.kaggle.com/openfoodfacts/world-food-facts
* 변수 엔지니어링 방법들 소개: 변수 변환, 변수 부분집합 선택, 변수 추출
* 주성분분석 (Principal component analysis: PCA) 와 특이값분해 (Singular value decomposition: SVD), t-SNE
* k-means clustering, hierarchical clustering
9주차
앙상블과 Boosting Tree Model
이론
- 나의 문제를 굳이 하나의 모델로 풀 필요가 있을까요? 앙상블 (ensemble) 은 여러 모델을 이용하여 좀 더 좋은 결과를 이끌어내는 방법입니다. 현재 앙상블은 여러 머신러닝 competition 대회에서 널리 이용되고 있습니다.
- 이를 기반으로 현재 Kaggle에서 가장 널리 사용되는 모델인 부스팅모델을 소개합니다.
실습
- 유방암 진단 [Breast Cancer Wisconsin (Diagnostic) Data SetPredict whether the cancer is benign or malignant]:https://www.kaggle.com/uciml/breast-cancer-wisconsin-data
   * 앙상블 전략: Voting, Bagging, Boosting, Stacking

실습 예시.

[ 남/여의 목소리 데이터를 활용한 의사결정 나무 모델링 ]

수강생 후기.

xx

파이썬을 활용한 머신러닝 CAMP 4기 수강생 오승열 님.

 안녕하세요, 저는 S사 생산기술연구소에서 근무하고 있는 오승열입니다. 주로 생산 설비 관련 S/W 개발을 담당하고 있습니다. 생산 설비에 사용되는 데이터를 S/W에서 스마트하게 활용할 수 있도록 연구하던 중에 본 강의를 수강하게 되었습니다. 머신러닝을 활용하여 문제를 해결하고 싶은데 시작하기가 겁이 나신다면 고민하지 마시고 수강하세요~ 강사님이 자신의 노하우를 녹여 구성하신 “머신러닝 완전정복 실습내용”을 따라가다 보면 저처럼 머신러닝을 시작할 수 있다는 자신감과 아이디어를 얻을 수 있을 것이라 생각합니다.

파이썬을 활용한 머신러닝 CAMP 6기 수강생 한 줄 후기

기초적인 프로그래밍 지식만 있어도 실무에 적용가능한 방법들을 배워갈 수 있는 강좌입니다.

A사 모바일 웹 개발자 K님

강의 만족도 96%

혼자 공부할 때보다 쉽게 기본 개념을 익힐 수 있고, 실제 사용법을 알 수 있었습니다.

H사 해외영엄팀 N님

강의 만족도 98%

강사님께서 머신러닝 관련 사전지식 및 연구 경험이 풍부하여 강의에 많은 도움이 됩니다.

대학원생 J님

강의 만족도 97%

현업 전문가가 직접 가르칩니다.

kth-250x250

고태훈 강사님.

 고태훈님은 서울대학교 산업공학과 데이터마이닝센터에서 박사학위를 취득하였으며, 현재 서울대병원 연구조교수로 재직 중입니다. 삼성전자, LG전자, 현대자동차, 현대중공업, 두산인프라코어 등 제조업 분야 기업체와의 연구 과제에 참여하였으며, 이외에 현대카드, ssg.com, 서울대병원 등 다양한 기관/기업체와의 연구 과제를 수행하였습니다. 현재 머신러닝과 딥러닝, 그리고 자연어처리 및 텍스트마이닝에 대한 연구를 진행하고 있습니다. 또한 실제 비즈니스에서 적용 가능한 데이터마이닝 프로세스, 그리고 이에 적용 가능한 기법을 찾아서 연결하는 에플리케이션에 대한 연구에도 많은 관심을 갖고 있습니다

미리 알아두면 좋을 선수 지식.

수업 전, 머신러닝에 도움이 될 만한 자료를 안내해드립니다.

본 강의는 머신러닝을 시작하고 싶은 분들 또는 머신러닝을 혼자 공부하면서 어려움을 겪는 분들을 위한 강의이기 때문에 [밑바닥부터 시작하는 데이터과학 – 데이터 분석을 위한 파이썬 프로그래밍과 수학통계 기초]도서를 미리 참고하시면 수업 이해에 도움이 많이 되실겁니다. 데이터 과학에 필요한 파이썬 프로그래밍과 데이터 과학분야에서 꼭 알아야 할 개념에 대한 내용이 담겨있습니다.

파이썬 선수 학습을 위한 무료 강좌를 안내해드립니다.

Python의 기초 문법 등에 대해서는 본 캠프에서 다루지 않습니다. Codeacademy의 Python 과정을 확인하시고, 해당 강좌에서 다루는 내용을 충분히 이해하고 계실 경우에만 본 캠프를 수강해주세요.

수강료.

머신러닝 구현을 위한 핵심 알고리즘에 맞춘 데이터 전처리, 결과 해석, 적용까지!

파이썬을 활용한 머신러닝 CAMP.

일    정 2019.1.7.~ 2019.3.18. 휴강 2/4(설연휴),2/11(강사님 학회일정)
매주 월요일 19:30 ~ 22:30 | 주 1회, 총 9주
준비물 개인 노트북 사용 추천
장    소 패스트캠퍼스 강의장 (강남역 부근)
문    의 이샘 매니저 : 02-518-4822 | help-ds@fastcampus.co.kr
메일로 문의 주실 경우 자세한 상담을 원하신다면 휴대폰 번호, 상담가능 시간을 남겨주세요!

정가 : 160만원

※출시알림을 신청하시면, 다음 기수 강의정보를 가장 먼저 받아보실 수 있습니다.
※할인가는 매주 목요일 자정에 변경됩니다.
※ 카드 12개월 무이자 할부 가능!

출시알림