데이터사이언스중급

R을 활용한 실무 데이터 분석 중급

일정 | ( 3일과정 / 09:00~18:00 / 총 24시간 )

09월반 : 2019년 09월 25-27일 (수-금)

11월반 : 2019년 11월 27-29일 (수-금)

12월반 : 2019년 12월 11-13일 (수-금)

정원 |  25명

장소 |  패스트캠퍼스 강의장

담당자  |  이다영 매니저, 02-541-5329

정가 : 1,100,000 원

할인가 : 880,000 원

개요

본 교육과정은 R을 학습해본 경험은 있는데 막상 실무에 활용은 못하고 계시는 분들을 위해 준비된 과정입니다.
실전에서 쓰이는 데이터 분석 노하우를 현업에도 적용할 수 있게 됩니다.
주성분 분석, 연관성 분석, 지도 그리기 등의 예시들을 스스로 분석 할 수 있도록 구성 되어있습니다.

특징

1) 비즈니스 데이터 분석의 절차와 각 절차에 맞는 방법론을 배울 수 있습니다.
2) 실무에 적용가능한 데이터 분석 및 R 활용에 대한 실제적인 해결책을 제시합니다.
3) R을 활용하여 보다 깊이있는 데이터분석 역량을 함양하고 싶은 분들을 대상으로 합니다.

커리큘럼

1 일차

▶ 탐색적 데이터 분석 (EDA)

– Rstudio 프로젝트 만들기 & 데이터 불러오기
– dplyr 패키지로 데이터 부분 선택하고 요약하기
– ggplot2, tabplot, treemap 패키지로 다양한 그래프 그리기
– tidyr 패키지로 데이터 형태 바꾸고 결측값과 누락조합 처리하기

▶ data.table을 활용한 대용량 데이터의 요약과 처리

– 기본함수 및 dplyr과 data.table의 비교
– data.table을 활용한 데이터 결합, 처리 및 요약
– 다양한 파생변수 만들기

2 일차

▶ 온라인상에 있는 텍스트 데이터를 불러오기
– 비정형 데이터 웹 크롤링 하기
– 텍스트 마이닝 맛보기

▶R을 활용해서 업무자동화 경험해보기 (사용자 정의 함수 활용)

– for loop를 활용한 반복문
– 사용자 정의 함수의 활용

▶쉽게 적용하고 유용하게 활용하는 머신러닝 I
– 머신러닝 개념 이해하기
– 선형회귀와 의사결정나무 비교하기

3 일차

▶쉽게 적용하고 유용하게 활용하는 머신러닝 II
– 분류 모형으로 확률 예측하기
– 군집화로 관측치 그룹 만들기

▶ 최신 기계학습 모형의 활용

– RF, GBM 등 앙상블 알고리즘의 이해
– H2O를 활용한 기계학습 모형의 적합과 활용

강사 소개

[주요 경력사항]
-(전) 삼성카드 근무 : 고객군 세분화 및 타겟 마케팅 등 실행
-고려대학교 일반대학원 통계학과 졸업,
기계학습(Machine Learning) 및 탐색적데이터분석(EDA) 중심
-고려대학교 정경대학 통계학과 졸업
-한국기업평가 논문 공모전(1위) : 계열사 리스크를 고려한 기업 신용등급 평가모형 개발
-SAS 마이닝챔피언십(2위) : 건강보험심사평가원 청구데이터 활용 청구 적정성 평가모형 개발
-관광 데이터마이닝 대회(2위) : 관광데이터활용 외국인 관광객 세분화 모형개발

[주요 강의이력]
-패스트캠퍼스 [R을 활용한 데이터 분석 입문] 강의 (10기 이상 다수 진행, 수강생 200명 이상 배출)
-서울과학기술대학교, 건국대학교 [데이터 분석 기초 CAMP] 강의
-이화여자대학교 [커리어캠프: 데이터 분석]
-S 금융사 [빅데이터 아카데미 실무과정] 2016 하반기/ 2017 상반기 강의
-A 뷰티사 [R을 활용한 데이터 분석 1, 2차수]
-H계열사, M 금융사, G 유통사 등 [R을 활용한 데이터 분석 입문] 다수 진행
-A 금융사 [데이터 분석 실무과정]
-K 유통사 [데이터분석 트렌드]

강의장안내

서울시 강남구 강남대로 364 미왕빌딩
강남역 4번 출구 바로 앞