R을 활용한

실전 데이터 분석 프로젝트 CAMP

이제는 실전이다!
데이터 전처리부터 나만의 프로젝트 완성까지!

#단계별실습#자기프로젝트
#1:1피드백

기간 & 일정

2019.03.05 – 04.23
매주 화요일 19:30 – 22:30 (3시간)
주 1회, 총 24시간

장소 & 준비물

패스트캠퍼스 강남강의장
강남역 4번 출구, 미왕빌딩
필기구, 필요시 노트북

담당자 & 문의

이샘 매니저
02-518-4822
help-ds@fastcampus.co.kr

우리는 분석 프로젝트를 진행할 때,
흔히 다음 고민에 맞닥뜨리곤 합니다.

대학원 연구논문을 위한
데이터 분석이 시급해요

데이터가 있어도
제대로 활용하지 못해요

실제 데이터 분석에서
변수/알고리즘을 어떻게 선택해야 할지 모르겠어요

알고리즘을 적용해야 하는데
데이터 전처리 단계에서 어려움을 겪고 있어요

대체로 문제는
2가지로 요약할 수 있습니다.

알고리즘 적용이나 결과를 해석하는 방법은 배웠는데
원하는 결과가 쉽게 나오지 않는다.

어떤 변수를 선택해야 하고
어떤 알고리즘을 넣어야 할지 모르겠다.

기성 강의들은 이런 사소한 문제들을 다루지 않습니다.
하지만 이를 무시하면, 절대 제대로 된 결과를 도출할 수 없습니다.

처음부터 끝까지 여러분 스스로
프로젝트 하나를 이끌어 봐야 압니다.

기존 분석
강의들의 함정.

데이터 분석을 배울 수 있는 강의는 참 많습니다.
하지만 알고리즘 공부를 처음 시작할 때 교재나 강의에서는 원활하게 진행했던 것들을, 직접 실무에 적용해 보려고 하면 종종 제대로 따라하기 어려울 때가 생깁니다. 강의에서는 알고리즘 이후의 단계만 배웠기 때문에 데이터 전처리나 혹은 어떤 알고리즘을 선택해야 할지에 대한 개념이 없었던 것이죠.

이제껏 실전 데이터 분석의 모든 것을 다 다루는 강의는 없었습니다.
데이터 분석의 한 사이클을 온전히 다루면서, 내가 마주하게 될 문제점을 바로 잡아줄 강의가 있다면 얼마나 좋을까요?

Garbage In, Garbage Out!

데이터가 엉망이면, 알고리즘이 아무리 좋아도 좋은 결과를 얻기 어려운 법!

그래서,
여러분의 원활한 분석 프로젝트를 도울
강의를 준비했습니다.

여러분의 손으로 직접
[정리되지 않은 데이터 더미]를 [양질의 결과]로 만들어 보세요!
실전 데이터 분석에 대한 막막한 두려움을 극복하실 수 있게 됩니다.

나만의
프로젝트 완성!

여러분의 이해를 강화하는 4-Steps curriculum으로

나만의 분석 프로젝트를 완성하는
분석의 A-Z를 직접 만나보세요.

프로젝트에 체계를
세웁니다

성공하는 프로젝트는 기획 뼈대부터 다른 법. 체계적인 커리큘럼으로 여러분의 결과물에 생기를 불어 넣습니다.

숨 쉴 틈 없는 밀착피드백

강의 중 막히는 부분이 있다면? 걱정 마시고 마음 편히 궁금증을 해소해 가세요. 강사님과 조교님이 1:1로 빠르게 피드백 드립니다.

나만의 프로젝트 획득!

편히 수업만 들을 순 없는 불편한 강의입니다. 수업시간 중 여러분의 개인 데이터로 결과물을 직접 만들어 내셔야 하니까요.

다시 혼자가 될 여러분을 위해

강의 후 혼자서 또 막힐까 걱정되신다고요? 교육용 샘플 자료로는 경험할 수 없는 실전환경을 만나보세요.

실전에서도 당황하지 않는 데이터 분석이 필요하다면,

지금 바로
{실전 데이터 분석 프로젝트}
하세요!

/ 강 / 사 / 소 / 개 /

여러분의 프로젝트에 힘을 보탤 강사님.

데이터 분석 전문가 이민호 님

現) 카카오 데이터 분석 업무
前) 넘버웍스 데이터 분석가

[강의경력]
2015년 꿈꾸는 데이터 디자이너 1~2기 R 강의 진행

“보고용 데이터 아닌,
‘진짜 실전 데이터 분석’을 경험해 보세요”

디테일한 유저 행동부터, 방대한 광고 로그까지 다양한 데이터를 다룹니다.

사내 각 서비스에서 쌓고 있는 데이터를 분석하여 의사결정을 돕거나 액션을 제안합니다.

반복되는 분석은 자동화하고, 분석결과가 더 많이 쓰일 수 있도록 플랫폼을 만들기도 합니다.

일로써 데이터를 다루다보니 Kaggle에 올라와 있는 문제들이 전부인 것만은 아니라는 것을 알게 되었습니다. 특정한 사람들에게만 데이터 분석이 필요하는 것도 아니라는 것을 알게 되었고요. 데이터를 통해 살펴보아야 하는 일들은 너무나 다양한 형태로 우리 도처에 널려 있습니다. 현실에서 흔히 접하게 될 다양한 문제들을 함께 살펴보고, 해결할 수 있도록 방향을 잡아드리고자 합니다.

/ 커 / 리 / 큘/ 럼 /

여러분의 프로젝트에 뼈대를 세울 커리큘럼.

문제 해결을 위한 접근방법과
R을 활용한 데이터 확인

1회차 강의 미리보기

  • 이론
    • 어떤 문제를 해결하려고 하는가?
    • 문제 해결하기 위하여 필요한 데이터 파악 및 접근방법 이해하기
    • R에 대한 오해와 진실
    • R을 사용하는 이유
  • 실습
    • 효과적인 분석을 위한 tidyverse 프레임워크 소개
    • csv, 엑셀, 구글 스프레드 시트등 다양한 형식의 데이터 불러오기
    • 테이블 형태의 데이터를 다루기 위한 도구인 dplyr 활용하기
    • 표와 그래프를 통해 데이터 살펴보기

탐색적 자료 분석 방법의 이해와
내 데이터를 분석 가능한 수준으로 전처리하기

2회차 강의 미리보기

  • 이론
    • 테이블 형태의 데이터를 다루는 방법 : join 이해하기
    • 분석하기 좋은 데이터로 가공하기(Tidy Data)
    • 데이터 전처리
    • 탐색적 자료 분석 (EDA)
  • 문제 해결
    • 분석은 하고 싶은데 데이터를 어떻게 가공해야 할까요?
    • 우리 서비스의 현황은 어떤지 알아보고 싶어요!
  • 실습
    • dplyr, tidyr을 활용하여 데이터 가공하기
    • ggplot2 을 통해 데이터 시각화하기
    • 문서 작성과 분석을 한 번에 할 수 있는 R Notebook 활용하기

회귀/분류모형으로
문제를 진단하고 예측하기

3회차 강의 미리보기

  • 이론
    • 변수들 사이의 관계 이해하기
    • 기본적인 모형들의 컨셉 이해하기
      • 회귀 모형 : Linear Regression, GLM
      • 분류 모형 : Naive Bayes, Decision Tree, Random Forest
    • 블랙박스 모형 해석하기
  • 문제 해결
    • 서비스에서 이탈할 것 같은 유저를 찾고 싶어요!
    • 구매에 가장 큰 영향을 미치는 요인은 무엇이죠?
    • 마케팅 비용 대비 매출이 가장 높은 판매 채널은 무엇인가요?
  • 실습
    • 머신러닝 도구 caret 패키지 이해하기
    • 모형은 왜 이렇게 예측했을까? iml 패키지를 통해 블랙박스 모형 내부 들여다보기

우리 서비스는 얼마나 성장하고 있는지
시계열 분석으로 확인해보기

4회차 강의 미리보기

  • 이론
    • 시간에 따라 변하는 지표에서 의미를 찾아내기
    • 일별 데이터에서 추세와 주기 분리하기
    • 쉽게 사용할 수 있는 모형을 통해 간단한 시계열 예측해보기
  • 문제 해결
    • 우리 서비스는 얼마나 성장하고 있나요?
    • 이번 프로모션이 얼마나 효과적이었는지 알고 싶어요!
    • 이번 연휴 때의 수요를 예상할 수 있을까요?
  • 실습
    • 시간/날짜 데이터 다루기 : lubridate
    • 시계열 모형 라이브러리 : prophet

차원축소 및 클러스터링을 활용해
사용자 유형화하기

5회차 강의 미리보기

  • 이론
    • 고차원 데이터를 더 단순하게 살펴볼 수 있는 다양한 차원축소 기법
    • 클러스터링을 통해 비슷한 항목끼리 묶어보기
    • 데이터에서 유의미한 피쳐 추출하기
  • 문제 해결
    • 변수가 너무 많아서 유의미한 변수만 사용하고 싶어요!
    • 사용자 그룹을 나누어보고 싶어요!
  • 실습
    • 차원축소 기법 실습 : PCA, EFA, t-SNE
    • 클러스터링 기법 실습 : knn, k-means, DBScan

연관성분석과
네트워크 분석에 대하여 알아보기

6회차 강의 미리보기

  • 이론
    • 연관성 분석 (어프라이어리 알고리즘)
    • 기초적인 네트워크 분석 이론
      • 네트워크를 설명하는 지표 알아보기
      • 커뮤니티 클러스터링
    • 네트워크 형태의 데이터 다루기
  • 문제 해결
    • 특정 고객군과 연관성이 높은 상품을 뽑아보고 싶어요!
    • 고객 간의 관계, 상품 간의 관계를 확인하고 싶어요!
  • 실습
    • 네트워크 형태의 시각화 다루어보기
    • arules, arulesViz을 활용한 연관성 분석
    • igraph를 활용하여 네트워크 다루기

내가 세운 가설, 개선안이
더 나은지 확인 및 검증해보기

7회차 강의 미리보기

  • 이론
    • 가설을 세우고 검증하기
    • 통계적으로 유의미한 값인지 확인하기 위한 절차 알아보기
      • p-value 안전하게 이해하기
      • 의사결정을 돕기 위한 다양한 장치들
    • 특정한 이벤트가 지표에 영향을 미쳤는지 확인하기
  • 문제 해결
    • A안과 B안 중 어떤게 더 나을까요?
    • 업데이트 이후 정말로 매출이 올랐나요?
  • 실습
    • 가설이 얼마나 믿을만한지 p-value와 신뢰구간을 계산하여 확인해보기

앞서 배운 내용을 바탕으로
나만의 프로젝트를 완성하기

8회차 강의 미리보기

  • 이론
    • 분석에 도움이 되는 다양한 팁 공유
    • 더 공부하고 싶다면?
  • 실습
    • 프로젝트 공유 및 피드백

/ 수 / 강 / 료 / 안 / 내 /

이 강의로 여러분의 데이터 분석 역량이 달라집니다.

R을 활용한
실전 데이터 분석
프로젝트 CAMP

❝강의일정❞

✓ 2019.03.05. – 04.23. (매주 화)
✓ 19:30 – 22:30
✓ 주 1회, 총 24시간

❝강의장소❞

✓ 패스트캠퍼스 강남강의장

출시할인 15%
₩ 1,270,000

정가 : ₩ 1,500,000
매주 목요일 가격이 인상됩니다. 15% 할인은 2월 21일 자정까지 입니다.

수강신청

카톡문의