R을 활용한

실전 데이터 분석 프로젝트 CAMP

이제는 실전이다!
데이터 전처리부터 나만의 프로젝트 완성까지!

#단계별실습#개인프로젝트
#1:1피드백

기간 & 일정

2019.03.12 – 04.30
매주 화요일 19:30 – 22:30 (3시간)
주 1회, 총 24시간

장소 & 준비물

패스트캠퍼스 강남강의장
강남역 4번 출구, 미왕빌딩
필기구, 필요시 노트북

담당자 & 문의

이샘 매니저
02-518-4822
help-ds@fastcampus.co.kr

강의 목표.

나만의 데이터를 활용하여
분석 프로젝트를 완성하는 것

“혹시, 이런 분석을 하고 싶으신가요?”

그런데, 어떻게 분석을 시작해야할지 몰라 답답하시다구요?

예제 데이터가 아닌
‘내 데이터로’ 결과를 만들어보세요!
데이터 분석, 직접 부딪혀봐야
진짜 당신의 실력이 됩니다.

강의 특징.

#혼자 하는 당신을 위한
온/오프라인 피드백

개인 데이터로 분석을 진행하다보면 내가 과연 잘 하고 있는 것인가에 대한 확인이 불가능해 어려움을 겪는 경우가 많습니다.
온/오프라인으로 진행되는 강사님의 꼼꼼한 1:1 피드백으로 여러분의 궁금증을 모두 해결해가세요!

#개별 데이터를 통한
맞춤형 전처리

아무리 좋은 알고리즘이라도 질 나쁜 데이터가 들어가면 좋은 결과물을 기대할 수 없습니다. 알고리즘 적용에만 초점을 맞춘 강의는 No!!
본 강의를 통해 데이터를 처음 접햇을 때의 접근법부터 전처리 노하우까지 모두 익혀가세요!

#따라만 하는 강의?
직접 고민 해보는 강의!

본 강의를 통해 분석 방향과 흐름을 잡고, 원하는 분석 결과를 도출하는 쾌감을 느껴보세요!
단순히 따라만 해보고 끝나는 강의가 아닙니다! 각자의 데이터를 어떻게 적용할 것인지 강사님과 함께 고민해보며,
나만의 프로젝트를 완성해 가실 수 있습니다.

추천 대상.

icon_man3_2_happy-150x150

지금 당장 실무에서
분석해야 하는
프로젝트가 있으신 분

icon_woman3_1_normal

R과 데이터 분석을
배웠지만, 현업에서의 활용법을
모르고 계시는 분

icon_man4_3_oh

분석 단계마다
예상치 못한 오류로
어려움을 겪는 분

커리큘럼.

Part 1. 문제를 정의하고 분석할 수 있는 환경 만들기

1회차 | 문제를 해결하기 위한 접근방법을 알아보고, R을 활용하여 데이터를 살펴봅시다.

이론

 

  • 어떤 문제를 해결하려고 하는가?
  • 문제 해결하기 위하여 필요한 데이터 파악 및 접근방법 이해하기
  • R에 대한 오해와 진실
  • R을 사용하는 이유

실습

  • 효과적인 분석을 위한 tidyverse 프레임워크 소개
  • csv, 엑셀, 구글 스프레드 시트등 다양한 형식의 데이터 불러오기
  • 테이블 형태의 데이터를 다루기 위한 도구인 dplyr 활용하기
  • 표와 그래프를 통해 데이터 살펴보기

2회차 | 탐색적 자료 분석 방법을 이해하고, 내가 가지고 있는 데이터를 분석 가능하도록 전처리하여 봅시다.

이론

  • 테이블 형태의 데이터를 다루는 방법 : join 이해하기
  • 분석하기 좋은 데이터로 가공하기(Tidy Data)
  • 데이터 전처리
  • 탐색적 자료 분석 (EDA)

문제해결

  • 분석은 하고 싶은데 데이터를 어떻게 가공해야 할까요?
  • 우리 서비스의 현황은 어떤지 알아보고 싶어요!

실습

  • dplyr, tidyr을 활용하여 데이터 가공하기
  • ggplot2 을 통해 데이터 시각화하기
  • 문서 작성과 분석을 한 번에 할 수 있는 R Notebook 활용하기

Part 2. 문제 해결 및 의사 결정을 위한 방법론 알아보기

3회차 | 회귀와 분류모형을 활용하여 진단하고 예측하기

이론

  • 변수들 사이의 관계 이해하기
  • 기본적인 모형들의 컨셉 이해하기
    • 회귀 모형 : Linear Regression, GLM
    • 분류 모형 : Naive Bayes, Decision Tree, Random Forest
  • 블랙박스 모형 해석하기

문제해결

  • 서비스에서 이탈할 것 같은 유저를 찾고 싶어요!
  • 구매에 가장 큰 영향을 미치는 요인은 무엇이죠?
  • 마케팅 비용 대비 매출이 가장 높은 판매 채널은 무엇인가요?

실습

  • 머신러닝 도구 caret 패키지 이해하기
  • 모형은 왜 이렇게 예측했을까? iml 패키지를 통해 블랙박스 모형 내부 들여다보기

4회차 | 시계열 분석을 통해 우리 서비스는 얼마나 성장하고 있는지 확인해보기

이론

  • 시간에 따라 변하는 지표에서 의미를 찾아내기
  • 일별 데이터에서 추세와 주기 분리하기
  • 쉽게 사용할 수 있는 모형을 통해 간단한 시계열 예측해보기

문제해결

  • 우리 서비스는 얼마나 성장하고 있나요?
  • 이번 프로모션이 얼마나 효과적이었는지 알고 싶어요!
  • 이번 연휴 때의 수요를 예상할 수 있을까요?

실습

  • 시간/날짜 데이터 다루기 : lubridate
  • 시계열 모형 라이브러리 : prophet

5회차 | 차원축소 및 클러스터링을 활용하여 사용자를 몇 가지 유형으로 나누어보기

이론

  • 고차원 데이터를 더 단순하게 살펴볼 수 있는 다양한 차원축소 기법
  • 클러스터링을 통해 비슷한 항목끼리 묶어보기
  • 데이터에서 유의미한 피쳐 추출하기

문제해결

  • 변수가 너무 많아서 유의미한 변수만 사용하고 싶어요!
  • 사용자 그룹을 나누어보고 싶어요!

실습

  • 차원축소 기법 실습 : PCA, EFA, t-SNE
  • 클러스터링 기법 실습 : knn, k-means, DBScan

6회차 | 연관성분석, 네트워크 분석에 대하여 알아보기

이론

  • 연관성 분석 (어프라이어리 알고리즘)
  • 기초적인 네트워크 분석 이론
    • 네트워크를 설명하는 지표 알아보기
    • 커뮤니티 클러스터링
  • 네트워크 형태의 데이터 다루기

문제해결

  • 특정 고객군과 연관성이 높은 상품을 뽑아보고 싶어요!
  • 고객 간의 관계, 상품 간의 관계를 확인하고 싶어요!

실습

  • 네트워크 형태의 시각화 다루어보기
  • arules, arulesViz을 활용한 연관성 분석
  • igraph를 활용하여 네트워크 다루기

7회차 | 내가 세운 가설, 개선안이 더 나은지 확인 및 검증해보기

이론

  • 가설을 세우고 검증하기
  • 통계적으로 유의미한 값인지 확인하기 위한 절차 알아보기
    • p-value 안전하게 이해하기
    • 의사결정을 돕기 위한 다양한 장치들
  • 특정한 이벤트가 지표에 영향을 미쳤는지 확인하기

문제해결

  • A안과 B안 중 어떤게 더 나을까요?
  • 업데이트 이후 정말로 매출이 올랐나요?

실습

  • 가설이 얼마나 믿을만한지 p-value와 신뢰구간을 계산하여 확인해보기

Part 3. 나만의 프로젝트 완성하기

8회차 | 앞서 배운 내용을 바탕으로 나만의 프로젝트를 완성하기

이론

  • 분석에 도움이 되는 다양한 팁 공유
  • 더 공부하고 싶다면?

실습

  • 프로젝트 공유 및 피드백

8주간의 대장정, 그 끝은?

본 자료는 실제 수강생분들이 8주동안 완성해 가신 프로젝트의 결과물들입니다.
지금 당장 완성해야 할, 완성하고 싶은 프로젝트가 있다면 여러분도 지금 바로 도전하세요!

8주 후, 당신은.

새로운 데이터를 접했을 때, 데이터 분석의 방향성을 잡고 원하는 분석 결과를 도출할 수 있습니다.

현실에서 데이터를 마주할 때, 어떻게 분석을 진행해야 할지에 대한 막연함이 줄어듭니다.

자신의 분석 목적에 맞는 프로젝트 결과물을 얻을 수 있습니다.

강사 소개.

이민호 강사님

現) 카카오 데이터 분석 업무
前) 넘버웍스 데이터 분석가

일로써 데이터를 다루다보니 Kaggle에 올라와 있는 문제들이 전부인 것만은 아니라는 것을 알게 되었습니다. 특정한 사람들에게만 데이터 분석이 필요하는 것도 아니라는 것을 알게 되었고요. 데이터를 통해 살펴보아야 하는 일들은 너무나 다양한 형태로 우리 도처에 널려 있습니다. 현실에서 흔히 접하게 될 다양한 문제들을 함께 살펴보고, 해결할 수 있도록 방향을 잡아드리고자 합니다.

내 수준에 맞는 R 강의! 잘 모르겠다면?

아래의 관련 강의 정보 및 수강생 선수 지식을 확인해보세요!

R도, 데이터 분석도, 통계도 전혀 모르는 입문자를 대상으로, R을 설치하는 방법부터 데이터 분석의 전반적인 내용까지를 폭넓게 학습할 수 있는 강의

강의 자세히 보기

R로 데이터를 불러오는 등의 간단한 작업이 가능한 초급자를 대상으로, 실무에서 바로 활용가능한 데이터 분석 방법을 3주만에 빠르게 익힐 수 있는 강의

강의 자세히 보기

변수 생성 및 추가, 반복문 코드 작성 등의 경험이 있는 초급자 혹은 개발자를 대상으로, 웹상의 데이터를 자유자재로 수집하는 방법을 익힐 수 있는 실전형 강의

강의 자세히 보기

R로 데이터 분석을 진행해 본 경험이 있는 초/중급자 분들을 대상으로, 개인의 데이터로 데이터 분석의 전 과정을 경험하며 분석 역량을 기를 수 있는 강의

강의 자세히 보기

수강료 안내

모집이 마감되었습니다.

정가:150만 원

# 모집이 마감되었습니다. 출시알림 신청으로 다음 강의 일정을 안내 받으세요!
# 할인가는 매주 목요일 자정에 변경됩니다.
# 할인가 적용 및 수강 확정은 결제일을 기준으로 합니다.

강의장 안내