데이터 분석을 위한 중급 R 프로그래밍 CAMP
기   간 9월 14일 ~ 11월 9일 (총 8주)
* 10월 5일은 추석연휴로 휴강합니다.
일   정 매주 목요일 7시 30분 ~10시 30분 (주 1회)
준비물 개인 노트북 권장
장   소 패스트캠퍼스 강의장
담당자 코스매니저 이샘 (02-518-4822)
help.camp.ds@fastcampus.co.kr


R은 쓸 줄 아는데
막상 실무에 가면 이런 고민이 생기셨나요?

Web이나 DB에 있는 빅데이터를 활용해 직접 분석해보고 싶어요.

R 기초는 아는데, 막상 전처리를 하려니 코드를 어떻게 짜야할지 모르겠어요.

R을 돌려서 분석결과는 나왔는데 보고서에 잘 표현하고 싶어요.

여러분의 고민을 해결해드리기 위해 본 CAMP를 준비했습니다!

R 입문자라고 하기엔 애매한, 그렇다고 R을 아주 잘 다룬다고 하기도 어려운
당신의 R 프로그래밍 실력을 한단계 끌어올려 줄 8주 과정을 소개합니다.

sdfsdf

point 1.

전처리-시각화-문서화 과정을 코딩 실습 위주로 학습합니다.

R 프로그래밍 실력을 키우기 위해서는 예제 코딩이 아니라, 실제 데이터를 가지고 직접 전처리부터, 분석, 시각화/문서화까지 모두 직접 해봐야 합니다. 본 캠프는 2-8주차에 걸쳐 전 과정을 실습을 통해 배우고 6주차에 진행되는 팀 별 미니 프로젝트를 통해 배운 내용을 온전히 체화할 수 있도록 커리큘럼을 구성했습니다.

point 2.

R을 보다 강력하게 활용하기 위한 github과 DB 사용법을 배웁니다.

R 코딩시 저장, 수정 히스토리를 남겨 수정을 하고 싶은 경우 원하는 상태로 빠르게 되돌릴 수 있는 버전 관리 시스템인 github의 사용법에 대해 배웁니다. 또한, SQL을 활용해 DB 내에 원하는 데이터를 추출하는 법을 가르쳐 드리기 때문에 R 사용의 시너지를 낼 수 있게 됩니다.

point 3.

강의 시간 외 격주로 강사님이 직접 스터디를 진행합니다.

본 캠프에서는 매주 배운 내용을 스스로 복습할 수 있도록 과제를 제공합니다. 과제 및 강의에 대한 질문은 페이스북 그룹을 통해 실시간으로 답변을 제공하며, 강사님께서 직접 운영하시는 스터디를 통해 과제에 대한 꼼꼼한 피드백을 제공합니다.

실습 예시

R을 활용해 분석한 데이터를 기반으로 시각적인 결과물을 구현한 실제 실습 예시 입니다.

이 강의 제가 정말 들어도 될까요?

[강의 적합도 사전 TEST]

본 캠프는 통계 기초 지식이 있으면서 R을 활용해 보다 심도있는 데이터 분석을 하고 싶은 분들을 듣기에 최적화 되어있습니다. 아래 질문에 답하고 나에게 맞는 강의인지 확인해 보세요!

랩탑에 R이나 R studio가 설치되어 있다.

R을 설치하고 간단한 코드를 작성해본 경험이 있거나, 독학해본적이 있으나 학습에 한계를 느낀다.

빅데이터 분석, 대용량 데이터 처리에 관심이 있다.

R에서 오류를 해결하는 방법을 알고 싶다.

단순한 그래프를 넘어서 보다 정교한 시각화(shiny등을 활용)를 배우고 싶다.

3개 이상의 질문에 YES라고 답하셨다면
데이터 처리부터 분석, 시각화 그리고 문서화까지 가르쳐드리는
본 강의를 수강하셔도 좋습니다.

3개 이상의 질문에 NO!
특히 1, 2번 질문에 ‘NO’라고 답하셨다면
입문자를 위한 강의를 추천합니다.

수강 후기

dabrp_asfj.001

제가 강의 수강 신청을 할 때는 데이터를 다루는 방법, 문서에 바로 활용할 수 있도록 문서화, 시각화하는 방법을 배우는 것만 기대했었습니다. 문서화를 위해 R 마크다운에 대해 스스로 찾아봤었는데, 설치 시작부터 힘들었거든요. 그런데 본 강의에서 제가 기대했던 내용은 물론, DB에 대한 개념, BigQuery 클라우드 컴퓨팅 연결 방법, Github 사용법까지 알려주셔서 데이터 분석에 필요한 내용을 모두 배울 수 있어서 좋았습니다.

lsm2.001

bigquery를 쓰는 방법도 이 강의가 아니었다면, 결코 몰랐을 겁니다. 전 R 자체가 통계 분석 같은 처리만 가능한 것이라 생각했는데, 다른 툴과 연동해서 R을 인터페이스로 활용할 수 있다는 것을 이 강의를 통해 알 수 있었습니다. R에서 DB를 연동해서 SQL문법으로 데이터를 전처리 하는 것, SQL구문으로 쿼리를 날려 R로 데이터를 불러오는 것은 정말 이 강의가 아니면 배울 수 없는 내용입니다. 그만큼 복습이 정말 중요합니다. 이 강의가 다양한 툴을 연동하고, 실제 데이터를 가져와서 전처리하고 시각화하는 방법 등을 깊이 있게’ 다루기 때문에 직접 해보면서, 시행착오를 겪고, 그런 부분을 강사님에게 질문하며 해결해나가는 과정이 커리큘럼을 온전히 체화하는데 정말 중요하다고 생각합니다.

dabrp_st.001

안녕하세요, 인하대학교에서 통계학을 전공하는 이세훈입니다. 수업 실습시간에 다루는 데이터는 대부분 미리 가공된 작은 양의 데이터였는데, 분석 대회를 참가하며 대용량 데이터를 분석하게 되었습니다. 데이터를 다 불러오는 것에도 오랜 시간이 소요되었고, 원하는 목적에 맞게 처리할 필요가 있었습니다. 그래서 이 부분에 대한 공부가 필요하다고 느꼈고, 본 강의가 저의 고민을 해결해 줄 강의였기에 주저 없이 신청하였습니다. 실무 데이터 분석을 위한 단비와도 같은 강의라고 생각합니다. R에서 SQL 문법을 사용하여 데이터를 빠르고 효과적으로 처리하는 방법에 대해 배울 수 있었고, Shiny라는 시각화 패키지와 마크다운이라는 문서화 패키지를 활용하여 직접 분석한 데이터를 시각화하고 문서화할 수 있는 방법을 학습할 수 있었습니다.

[ 데이터 분석을 위한 중급 R 프로그래밍 CAMP 2기 수강생 한 줄 후기]

SQL, Git, Markdown 등 다른 강의에서 쉽게 접하지 못했던 걸 배우게 되어 좋았습니다.

강의 만족도 95%

강사님이 친절하게 설명해주십니다. 시대의 트렌드에 맞는 전반적인 내용을 다 배울 수 있어서 좋았습니다.

강의 만족도 93%

커리큘럼

회차 내용
1. 중급으로 나아가기 위한 Level UP Skill
1 Step1. 코드 작성과 관리를 위한 도구 연습
코드작성을 할 때 도움을 주는 RStudio와 버전 관리를 위한 github 사용법을 익합니다. 코드의 업데이트 기록을 남겨, 시점별로 수정내역을 확인할 수 있습니다.
이론 - 프로젝트 생성의 의의와 장단점
- git의 동작방식과 github과의 다른 점
실습 # 프로젝트 생성과 관리
- Rstudio 사용법과 유용한 기능 사용하기
- 유용한 프로젝트 환경 설정하기 : git, Rtools(for windows), github desktop 등 설치하기
- 프로젝트 만들고 git 관리 세팅하기

# 원격 저장소 활용(github)
- github에 코드 저장하고 공유하기
- 다른 사람의 github 코드 활용하기
2 Step2. 하나의 문법으로 다양한 소스의 데이터를 다뤄보기
데이터 베이스의 기본을 이해하고 R로 연결하는 법을 실습합니다 데이터베이스와 R을 연동시켜 효율적인 자료 입/출력이 가능해집니다.
이론 - R에서 다루는 데이터 소스로서 데이터 소스로서 데이터 베이스의 의미
실습 # 클라우드 플랫폼
- 클라우드 플랫폼을 활용하여 외부 데이터 베이스 사용하기
- 데이터 베이스에 자료를 입력하기
- 데이터 베이스의 자료를 확인하기
2. 데이터 분석의 기본이 되는 데이터전처리
3 Step1. 데이터 전처리를 위한 SQL기초 학습하기
데이터 베이스 언어인 SQL 기초와 함께 R의 중요 데이터 관리 패키지인 dplyr을 연습합니다.
이론 - SQL 기초초 문법 체계
- dplyr 기초 문법 체계
- tidy data란 무엇인가
실습 # 데이터 1개를 다룰 때의 전처리
- sql 기초 문법 동작 확인하기
- dplyr 로 데이터 중에 필요한 부분만 가져오기

# 데이터 여러 개를 함께 다룰때의 전처리
- 데이터를 합치는 join 연습하기
- 합친 데이터 결과를 확인하기 위해 검증하기
- dplyr로 다룰 수 있는 여러 데이터 소스 확인하기
4 Step2. 데이터 전처리에 유용한 정규표현식과 유용한 함수 학습하기
정규표현식만 알아두면 손쉽게 숫자 및 문자의 제거/추출/변환 등이 가능해집니다. apply함수를 실습하여 빠른 데이터 전처리를 실습하여 봅니다.
이론 - 정규 표현식의 기초 문법
- 정규 표현식과 함께 사용하는 R 함수 소개
- 빠른 데이터 처리를 위한 apply류 문법 소개
실습 # 정규표현식
- 정규표현식 기초 문법과 헷갈리기 쉬운 부분 확인하기
- 자주 사용하는 정규표현식 뜯어보기
- 정규식과 함께 사용하는 grep, gsub 등 실습

# apply family
- 빠른 데이터 처리를 위한 apply 함수 실습
- for 문 apply로 바꿔보기
회차 내용
3. 멋진 보고와 설득을 위한 데이터시각화
5 Step1. 분석결과를 효과적으로 보여주는 데이터 시각화
데이터를 시각화 하기 위한 패키지인 ggplot2의 기초 문법과 동작 방식을 이해합니다.
이론 - data, mapping, layer 규칙
- 잘못 사용하기 쉬운 예시 소개
- 우리나라에서 사용하는 좌표계와 지도 활용
- 한국 지도 패키지인 kormap 소개
실습 # gapminer를 활용한 데이터 시각화
- ggplot 객체를 확인하며 동작 방식 추적하기
- mapping 선언 규칙에 맞게 그림을 그려보기
- group, facet 등 다양한 모양으로 그림 그리기

# 지도 그리기
- geocoding으로 주소의 위경도 좌표 가져오기
- 좌표 데이터를 바탕으로 지도 위에 그림 그리기
- 경계선을 바탕으로 지도 그림 그리기
4. 배운 내용을 내 것으로 만드는 미니프로젝트
6 실전! 미니 프로젝트
데이터베이스에서 데이터를 불러와, 데이터전처리부터 시각화까지! 앞서 배운 내용들을 토대로 미니프로젝트를 진행하며 분석 Skill을 내것으로 만듭니다.
프로젝트 - 2~3인 이 팀을 이뤄 1~2개의 미니 프로젝트 진행
- 클라우드 서비스 세팅 및 사용, 데이터 전처리, 시각화를 활용한 프로젝트
피드백 - 각 프로젝트에 대한 강사 피드백 제공
5. 더욱 프로답게 만드는 동적 문서화 및 시각화
7 Step1. 복사-붙여넣기해도 서식이 깨지지 않는 문서화 방법 익히기
문서에 역할을 정의하는 markdown을 배우고 R코드를 함께 사용하는 방법을 익힙니다. 실행결과를 발표자료, pdf, html, 워드 문서 등으로 쉽고 빠르게 변환할 수 있습니다.
이론 - 텍스트 구조의 정의와 디자인 분리
- 텍스트 구조 선언을 위한 markdown 문법
- Rmd에 R code를 삽입하여 사용하는 방법
실습 # markdown
- markdown 문법 연습하기

# Rmarkdown
- Rmarkdown 제작을 위한 환경 설정
- Rmd를 활용한 html 문서 제작
- Rmd를 활용한 word 문서 제작
- html 문서 공유하기(rpub, github)
8 Step2. 클릭에 실시간으로 반응하는 Shiny Application 학습하기
마우스 클릭에 반응하는 문서를 shiny를 통해 만들어보고 동작 원리를 확인합니다. 코딩이 아닌 마우스 클릭만으로 데이터에 따른 서로 다른 시각화 도출이 가능합니다.
이론 - 웹 페이지 작성의 간단한 구조 설명
- shiny 에서 ui와 server의 역할
- 데이터 바인딩을 위한 input과 output
실습 # Shiny
- example을 실행하여 구조 파악하기
- example을 수정해보기
- 지난 시간의 결과들을 shiny 로 변환해보기
- 다양한 shiny ext 패키지 살펴보기

강사 소개

unnamed (1)

박찬엽

박찬엽 강사님은 현재 서울도시가스에서 AI 연구원으로 일하고 있습니다. 연세대학교 정보대학원에서 비즈니스 데이터 분석을 전공하였고, 빅데이터 석사과정인 SMBA(Strategic Management of Big data Analytics)의 TA로 통계, 분석 수업을 진행했습니다. 신한카드 빅데이터 센터, 넷마블, 스포카에서 R 관련 데이터 분석 프로젝트를 진행했으며 데이터 핸들링, 분석 자동화, 데이터 시각화에 강점이 있습니다.

FAQ

1. 분석결과를 진짜 원하는 대로 시각화할 수 있나요?

네, 그렇습니다. 데이터를 가공해서 결과를 만들어도 문서화, 시각화를 하지 않으면 활용하기 어렵다고 많이 느끼셨을 겁니다. 그래서 본 강의에서는 Shiny라는 시각화 패키지마크다운이라는 문서화 패키지를 활용하여 직접 분석한 데이터를 시각화하고 문서화할 수 있도록 차근 차근 도와드릴 예정입니다.

2. Github이 뭔가요?

dd

버전관리시스템의 하나로 구글 드라이브처럼 어디서든 편집이 가능하고 데이터나 코드를 따로 옮길 필요가 없습니다. R을 사용할 때 저장, 수정 히스토리를 남겨주는 역할을 하기 때문에 수정을 하고 싶은 경우 원하는 상태로 빠르게 되돌릴 수 있습니다. 그래서 협업을 하기에도 매우 편리합니다. 이처럼 Github은 편집한 모든 내용을 히스토리로 남길 수 있어 자신의 데이터 분석결과와 코드를 관리하기에 가장 좋은 툴입니다. 본 강의에서 활용한 Github을 자신의 포트폴리오로 활용해보세요!

수강료

일반 등록가

150만 원

* 출시알림을 신청해주시면, 다음 기수 모집 시 가장 먼저 알려드립니다.