학습목표를 끝까지 달성하고
결제액의 최대 20% 학습지원금을 받아가세요!

파이썬을 활용한

데이터 전처리
Level-Up CAMP

데이터의 상황에 맞는 적절한 전처리 방법을 익히고,
머신러닝 프로세스의 시행착오를 단축시킬 수 있는 강의

#데이터_탐색#유형별_전처리
#시행착오_최소화

기간 & 일정

2019.05.15 – 06.19
매주 수요일 19:30 – 22:30
주 1회, 총 18시간

장소 & 준비물

패스트캠퍼스 강남강의장
강남역 4번 출구, 미왕빌딩
개인 노트북

담당자 & 문의

윤형진 매니저
02-517-0641
help-ds@fastcampus.co.kr

강의 목표.

EDA로 데이터 품질 문제를 찾아내 데이터의 유형에 맞는 전처리 방법을 선택하고,
머신러닝 프로세스에서 겪는 시행착오를 줄이는 것.

당신이 겪고 있는 문제,
어떤 문제인지 알고 계시나요?

어떤 변수 상에 결측데이터가
관측된 혹은 관측되지 않은
다른 변수와 아무 연관이 없다!

결측치 문제

신용카드 도용, 질병 검사,
공정 불량품 예측 등 관심있는
예측변수의 클래스가 매우 적다!

클래스 불균형

데이터에 불필요한 변수가 섞여
학습에 필요한 독립적 샘플이 줄어들고,
더 많은 데이터를 필요로 한다!

차원의 저주

이처럼 실무에서 쓰는 데이터는
복잡하고 지저분할 뿐더러,
각기 다른 문제들을 가지고 있습니다.

실무에서 지저분한 raw data를 분석하게 되면 예시와는 다르게 한 번에 복잡하고 많은 문제를 겪고, 가이드 없이 직접 전처리를 해야하기 때문에 막막해집니다. 혹은 알고리즘을 적용하고 모델을 만들었어도, 데이터 자체가 왜곡되어있기 때문에 검증 결과가 좋지 못합니다. 결국 처음부터 다시 전체 프로세스를 해야하는 Loop에 빠질 수 있습니다.

본 과정은 이런 어려움을 겪는 분들을 대상으로 데이터셋의 품질을 파악하는 방법, 전처리에 필수적인 파이썬 라이브러리를 효과적으로 사용하는 방법을 가르쳐 드립니다. 또한 데이터셋의 전처리 시 이슈별로 해결방법을 배우고 직접 실습해봄으로써 어떠한 실무 데이터 앞에서도 막막함없이 전처리하고, 최상의 분석 결과값을 도출할 수 있는 역량을 기를 수 있습니다.

강의
특징.

ti323a6417

데이터 품질 유형별 전처리 방법 학습

입문자의 경우 본 강의에서는 3주차부터 5주차까지 각기 다른 데이처 품질에 따른 전처리 해결방법을 학습합니다. 1) 파편화된 데이터, 2) 결측치 문제, 3) 클래스의 불균형, 4)차원의 저주까지 총 4가지의 빈번한 전처리 시 이슈를 함께 살펴보고 효과적으로 전처리하는 방법과 노하우를 전합니다.

12345

실전 경험이 풍부한 강사님의 노하우 공유

비단, 전처리만이 아니라 이상적인 머신러닝 프로세스와 현실에서의 프로세스를 비교하고, 과정 반복을 줄이기 위한 실질적인 노하우를 공유합니다. 이를 위해 효과적인 파이썬 라이브러리( Pandas, Numpy / Scipy, Matplotlib, Scikit-learn)의 사용법, 프로세스별 주의사항, 데이터 품질 파악 방법 등을 배우게 됩니다.

093

강의 내용을 종합한, 실전 머신러닝 미니 프로젝트 진행

전처리를 유형별로 익히고, 노하우를 학습하더라도 직접 내가 처음부터 끝까지 해보지 않으면 온전히 체득할 수 없습니다. 때문에, 본 강의에서는 마지막 6주차에 직접 지저분한 데이터셋을 가지고 머신러닝 프로젝트를 진행합니다. 이를 통해 강의 중 본인이 온전히 이해하지 못한 부분을 체크하고, 강사님이 피드백을 제공하여 실무에 돌아갔을 때의 시행착오를 최소화할 수 있도록 도와드립니다.

공부도 하고!
학습지원금도 받고!

결제액의 10%를 학습지원금으로 드립니다.

패스트캠퍼스의 수강의지를 강화하기 위한 지원금 제도를 운영합니다
패캠이 제안하는 학습 목표를 달성하고 커리어 이상의 성취감을 얻어가길 바랍니다.

*학습지원금은 제세공과금(22%)을 제하고 드립니다.

학습노트

100% 제출

커리
큘럼.

1주차. 데이터 품질 문제와 데이터 탐색/ 전처리 가이드라인

– 머신러닝 프로세스
– 피드백 루프의 개념 및 사례
– 주요 데이터 품질 문제의 정의: 데이터 파편화, 데이터 분포 문제, 결측치, 이상치, 클래스 불균형, 차원의 저주
– 데이터 탐색 및 전처리 가이드라인
– 분석 모델 선택의 가이드라인

2주차. 데이터 탐색과 전처리를 위한 주요 파이썬 모듈

– 수치 계산 모듈 Numpy
– 데이터 가공 모듈 Pandas
– 머신러닝 모듈 Scikit-Learn

3주차. 데이터의 파편화 및 분포 문제

– 데이터 파편화 문제의 정의
– 데이터 파편화 문제 유형 별 해결 방법
– 결측치 문제
– 이상치 문제

4주차. 클래스 불균형 문제

– 클래스 불균형 문제의 정의
– 클래스 불균형 문제 해결 방법 1: 재샘플링
– 클래스 불균형 문제 해결 방법 2: 비용 민감 모델

5주차. 차원의 저주 문제

– 차원의 저주 문제의 정의
– 특징 선택
– 주성분 분석

6주차. 프로젝트

– 최종 모델 도출 및 저장
– [프로젝트] 부정 리뷰 분류
– [프로젝트] 오존 수준 예측
– [프로젝트] 판금 불량 예측

강의
자료.

(*본 강의에서 사용하는 강의 자료 예시입니다.)

추천
대상.

icon_man4_1_normal

RAW DATA를 만나면
어떻게 해야할지
감이 잡히지 않는 분

icon_woman3_1_normal

각 데이터에 어떤
전처리 방법을 선택해야 할지
판단하기 어려운 분

icon_woman4_4_unhappy

머신러닝 프로젝트에서
시행착오를 겪어, 전 단계로
돌아가는 상황이 반복되는 분

강사
소개.

asw

안길승 강사님

[ 약력 ]

– 현) 한양대학교 산업경영공학과 박사과정
– 데이터 전처리 기법 개발 관련 연구 다수 수행: “소속확률 기반 언더 샘플링 기법”, “다변량 시계열 데이터 분류를 위한 특징 선택 기법” 등
– 미래에셋대우 빅데이터 경진대회 대상 수상
– KT 인공지능 소설 공모전 수상
– 현대자동차 텍스트마이닝 툴 개발 프로젝트 실무 책임

수강
후기.

ppc_오혜신님_정

수강생 오혜신님

[파이썬을 활용한 데이터 전처리 Level-Up CAMP]는 데이터 전처리에 대한 내용을 체계적으로 정리해주는 커리큘럼을 보유하고 있을뿐더러, 실무에서 접하는 애매하고 어려운 상황들에 대한 적절한 가이드라인을 제시해준다는 점이 굉장히 매력적입니다. 특히, 강사님께서 전처리 문제를 유형별로 정리해주시고 그에 맞는 해결법을 정리해주시는 점과, 직접 짜기 어려웠던 코드를 다른 곳에까지 활용할 수 있도록 제공해주시는 점이 가장 좋았습니다.

FAQ.

파이썬에 익숙하지 않은데, 코스 수강이 가능할까요?

본 코스는 데이터의 탐색과 전처리를 주요 내용으로 다루며, 이를 위한 수단으로 파이썬을 활용하고 있습니다. 따라서, 수강생분들께서 파이썬 기본 문법에 대해 알고 계시다는 전제 하에 수업이 진행됩니다.

머신러닝을 어느 정도 알아야 코스 수강이 가능할까요?

‘지저분한 raw 데이터’를 정리하는 것은 머신러닝 프로세스에서 겪는 시행착오를 단축시키기 위함입니다. 서포트 벡터머신, 신경망, 베이즈 등 머신러닝 지도학습의 주요 모델 개념을 이해하고 계셔야 코스 내용도 무리 없이 소화하실 수 있으며, 코스 종료 후 실무 적용에도 도움을 받으실 수 있을 것입니다.

{ FASTCAMPUS COMMUNITY MEMBERSHIP }

패스트캠퍼스 오프라인 강의를 수강하셨다면!
별도의 가입절차없이 패스트캠퍼스 커뮤니티 멤버쉽 회원이 됩니다.
커뮤니티 멤버쉽은 수강 후 1년 동안 유지되며,
오직 멤버들만을 위한 비공개 스터디클럽, 네트워킹행사, 세미나 등 비정기적 행사에 모실 예정입니다.

수강료 안내

다음 기수 강의 정보가 궁금하다면? 출시알림을 신청하세요!

정가: 80만 원

# 할인가는 매주 목요일 자정에 변경됩니다.
# 할인가 적용 및 수강 확정은 결제일을 기준으로 합니다.추

강의장 안내

학습 지원 프로젝트

공부도 하고! 학습지원금도 받고!

*학습지원금(제세공과금 22% 차감 후 지급)은 강의마다 개인마다 상이할 수 있습니다.

학습 목표 1. 학습노트 100% 제출

-과제 형태: 학습노트 작성.
-과제 제출 일정: 코스 진행 3일 후(화요일), 24:00까지 폼스택으로 과제 제출. (과제 접수 여부는 폼스택 접수시간으로 판단됩니다)
-수강중 학습 콘텐츠 일정 (학습노트 제출 6회)
1회차: 5월 18일(토)까지 학습노트 작성 후 제출
2회차: 5월 25일(토)까지 학습노트 작성 후 제출
3회차: 6월 1일(토)까지 학습노트 작성 후 제출
4회차: 6월 8일(토)까지 학습노트 작성 후 제출
5회차: 6월 15일(토)까지 학습노트 작성 후 제출
6회차: 6월 22일(토)까지 학습노트 작성 후 제출

학습지원금을 받으려면?

미션을 모두 완료하면 신청페이지를 통해 신청 가능합니다.
다만, 강의 종료 후 30일 이내에 신청페이지를 통해서 신청해주셔야 합니다.
아래의 환급신청 링크로 신분증 사본 / 환급받을 통장사본을 제출 (반드시 본인 명의로만 가능)해 주세요.
결제한 수강료의 10% (환급 금액의 22% 제세공과금으로 차감) 를 드리며, 학습지원금은 개인마다 상이할 수 있습니다.

환불규정

* 학습지원금은 기수강생 할인만 중복 적용이 가능합니다. (기타 다른 이벤트와 중복 적용이 불가합니다.)
* 과제물이 허위로 작성되거나 표절일 경우 환급이 거절될 수 있습니다.
* 환불은 환불규정(https://www.fastcampus.co.kr/refund/)에 따라 진행됩니다. 규정에 의거하여 환불금액이 없을 수 있습니다.