2020년 상반기 단 한번뿐인 기회를 잡으세요!

할인 마감 → D-

Apache Spark을 이용한
빅데이터 분석
입문 CAMP

Spark의 핵심 개념부터 라이브러리 활용,
추천시스템 구현까지 이제는 한 번에 해결!

#최신Spark#Spark SQL
#Spark Streaming#실습물구현

기간 & 일정

2020.02.05 – 04.29
(4/15 휴강)
매주 수요일 19:30 – 22:30
주 1회, 총 36시간

장소 & 준비물

패스트캠퍼스 강남강의장
노트북 (RAM 8GB 이상)

문의

02-568-9886
help-ds@fastcampus.co.kr

“기껏 배웠는데 한달만에 업데이트가 돼서 데이터가 안 돌아가요”

하루가 다르게 변하는 빅데이터 관련 기술 특성상, 수시로 버전업이 됩니다. Apache spark도 마찬가지죠. 이런 상황에서, 어제까지 구버전에서 돌아갔던 데이터들이 오늘 업데이트 된 신버전에서는 먹통이 되는 경우가 부지기수입니다.

“배운 대로 회사에서 해보니 잘 안되는데 어디에 물어봐야 되나…”

물론, 여러 자료들을 찾아서 Apache spark를 배워보긴 했어요. 그런데 실전에서 적용하려고 하면 제대로 되지 않는 경우가 많았습니다. 아무리 혼자서 열심히 배워도 제 서버 환경에서 돌아가지 않으면 쓸모가 없더라구요. 여기에 대해 조언을 구할 데도 없구요.

“배울 것도 자료도 많아도 너무 많아…정리된 자료 어디 없나요?”

Spark를 제대로 활용하려면 Spark Core Components 및 RDD Operation는 물론, Spark SQL, Spark Streaming, Spark MLlib 라이브러리까지 익혀야 합니다. 여기에 배포, 인프라, Hadoop, 리눅스, 분산처리 등 Spark 사용을 위한 배경지식까지 챙길 것이 너무 많죠. 혼자서 공부해보려고 구x링을 해봤지만 제대로 된 자료 찾느라 시간만 보냈어요.

너무 빠르고 잦은 빈도의
프레임워크 업데이트

같은 데이터도 다른 환경에서
분석 오류가 일어나기 쉬움

인터넷에 많은 자료들 중
잘 정리된 자료는 찾기 어려움

업데이트된 내용이 바로 반영되고, 최신 버전의 Spark로 실습한다는 점이 이 강의에서 가장 마음에 들었습니다. 제가 생각하기에 국내에서 Spark을 이렇게 체계적으로 가르쳐주는 곳은 거의 없습니다. 고민하시는 분들 또한 강의를 통해 빅데이터와 Spark의 진면목을 음미하시기를 권합니다.

강사님이 하나하나 천천히 알려주시기 때문에 입문자 입장에서 수업을 따라하는데 큰 지장이 없었습니다. 스파크에 대한 강사님의 이해도와 강의 수준이 매우 뛰어나고, 제공하는 실습 프로젝트와 수업 자료들이 강의 후에도 참고하기에 잘 갖춰져 있습니다. 믿고 따라가셔도 됩니다.

그간 어디에서도 제대로 배우기 힘들었던 Spark 개념 및 설치, 활용법에 대한 상세한 설명이 많은 도움이 되었습니다. 제가 생각하기로 앞으로 데이터 분야에서 계속 공부나 업무를 하는 분들이라면 당연히 들어야 할 코스라고 생각합니다. 그만큼 만족도가 매우 높았습니다.

“이제는 이전 버전으로 대충 기능 배우기에만
급급하지 않아도 돼서 좋습니다”

“강사님의 꼼꼼한 피드백과
‘추천 시스템 프로젝트’ 실습 덕분에
배운 것을 실무에 완벽히 적용했습니다.”

“완벽하게 정리된 자료가 있으니
자료 찾는데 시간을 아낄 수 있어서 좋아요.”

Apache Spark을 이용한 빅데이터 분석 입문,
빅데이터 입문자에게 가장 빠르고 정확한 길입니다.
2020년 상반기 단 한 번의 기회
절대 놓치지 마세요!

※ 잠시만요! 본 강의는 아래의 선수지식이 권장됩니다.

기본적인 Java 문법을 알고 있다면, 강의를 보다 쉽게 이해할 수 있습니다.

icon_man4_3_oh

Spark을 실무에서 사용하고 싶지만
기초가 부족하여 어려움을 겪는 분

icon_woman3_1_normal

단순 사용법을 넘어서서 제대로 된
Spark 활용 역량을 필요로 하는 분

icon_woman3_1_normal

Spark를 공부해 보고 싶지만
제대로 된 학습자료가 없어서 고민하는 분

공부도 하고
학습 지원금도 받고!

결제액의 10%를 학습지원금으로 드립니다.

패스트캠퍼스의 수강의지를 강화하기 위한 지원금 제도를 운영합니다
패캠이 제안하는 학습 목표를 달성하고 커리어 이상의 성취감을 얻어가길 바랍니다.

*학습지원금은 제세공과금(22%)을 제하고 드립니다.

학습노트
100% 제출

Part 1. Apache Spark, 꼭 알아야 할 핵심 개념 (1~3회차)

Apache Spark 이해하기

자세히 보기

Apache Spark의 정의와 특징을 살펴보고 그 작동원리를 이해합니다.
Apache Spark에서 사용하는 Scala 언어의 특징을 알아보고 기본적인 사용법을 배웁니다.
Apache Spark 실습진행을 위해 필요한 설치 및 환경설정을 합니다.

– Spark 개요(Apache Spark 소개, 특징, 지원언어, Hadoop과 비교, Spark 프로그래밍 모델(RDD), 작동원리, Spark Components 등)
– Scala 개요(Scala 언어 소개, 특징, 변수 선언, 함수 정의 등 기본 문법)
– Spark 설치 및 실행(VirtualBox, CentOS7, Java 8, Spark 설치 및 환경설정, 프로세스, Lineage 확인 등 Spark Shell 기본 사용법)

Spark Core

자세히 보기

Spark Core Components 각각의 기능을 살펴보고, 분산환경(클러스터) 설정과 함께 RDD Operation을 이해합니다.
RDD 생성부터 Transform까지 RDD 프로그래밍을 해봅니다.
병렬 수행되는 클러스터상의 Task를 위한 Shared Variables에 대해 배웁니다.

– Spark RDD 개요(Spark Core Components, Spark Application 배포, RDD Operations 등)
– RDD 프로그래밍(RDD 생성, RDD Transform, RDD Action 등)
– Shared Variables(Broadcast, Accumulators)

Part 2. Apache Spark의 다양한 라이브러리 정복하기 (4~10회차)

Spark SQL

자세히 보기

Spark 기반으로 SQL을 사용하기 위해 필요한 기본개념과 DataFrame/Dataset, Catalyst Optimizer에 대해 배웁니다.

– Spark SQL 개요(특징, 성능, RDD와 DataFrame/Dataset의 비교, SparkSession)
– DataFrame/Dataset(생성법, Basic Operations, Queries, Join, 저장, Row Object 처리 등)
– Catalyst Optimizer 및 Tungsten Project 작동원리

Spark Streaming

자세히 보기

실시간으로 스트림 데이터를 빠르게 처리하는 Spark Streaming과 Structured Streaming을 배웁니다.

– Spark Streaming(특징 및 기능, DStream의 개념 및 Basic Operations, Stateful Operations, Execution Model, DStream Persistence, Checkpoint, Kafka 연계 등)
– Structured Streaming(DStream의 문제점, Programming Model, Window Operations, Watermarking 등)
– 실습 데이터 : twitter를 이용하여 SNS 데이터 수집

Spark ML

자세히 보기

Spark ML의 특징을 살펴보고, 사용가능한 알고리즘들을 알아봅니다.다양한 모델을 구축하고 테스트하는 방법에 대해 배웁니다.

– Spark MLlib(특징, 머신러닝 분류, 데이터 유형,,Word2Vec, VectorAssembler, ChiSqSelector 등)
– MLlib Algorithms(Classification, Regression, Clustering, Collaborative, Filtering, Dimensionality Reduction)
– ML Pipeline(Estimator, Transformer, Paramerter, Pipeline)
– Model Selection(CrossValidator, TrainValidationSplit)
– ML Persistence(Status, Predictive Model Markup Language)

Part 3. 추천시스템 구현 프로젝트 (11~12회차)

Recommender system with Spark

자세히 보기

10주간 배운 내용들을 바탕으로 Cassandra와 Redis 등을 활용하여 음악추천시스템의 기본내용을 구현해봅니다.

– 추천시스템의 개요(추천시스템 아키텍처 및 알고리즘, 배치 추천시스템과 실시간 추천시스템)
– 추천시스템 구현(음악추천시스템)
– 실습 데이터 : 음악 예제 데이터

강경인 강사님
데이터 엔지니어

대용량 데이터 실시간 처리/분석 기술을
연구하고 플랫폼을 개발합니다.

현재 통신/제조 분야에서 Apache Spark를 중심으로,
빅데이터 실시간 분석 및 머신러닝 시스템을 위한
OSS 기술지원을 담당하고 있습니다.

이 코스를 수강하려면 프로그래밍 지식이나 스킬이 많이 필요한가요?

필수적이지는 않지만, 기본적인 Java 문법을 알고 계시면 강의 이해가 수월합니다. [생활코딩 JAVA 1] 수준의 이해를 권장드립니다.

분석적인 내용보다는 Spark와 Hadoop의 연동에 관심이 많아요. 이 코스가 적합할까요?

아닙니다. 본 코스는 Spark를 활용해 빅데이터를 분석하는 것을 주요 목표로 하고 있습니다. 따라서 Hadoop 플랫폼 상에서 Spark의 설치 및 구축, 그리고 Hadoop과의 연동을 학습하시고자 한다면 [Apache Hadoop으로 구축하는 분산처리 빅데이터 플랫폼 입문 CAMP]를 추천드립니다.

데이터 수집부터 전처리, 분석, 시각화까지 일련의 관정인 데이터 파이프라인을 구축하고 운용하는 것에 관심이 많습니다. 이 코스가 적합할까요?

아닙니다. [실무에 활용하는 데이터 파이프라인 구축 CAMP]에서 데이터 파이프라인의 구축과 운용 노하우를 학습하실 수 있습니다.

{ FASTCAMPUS COMMUNITY MEMBERSHIP }

패스트캠퍼스 오프라인 강의를 수강하셨다면!
별도의 가입절차없이 패스트캠퍼스 커뮤니티 멤버쉽 회원이 됩니다.
커뮤니티 멤버쉽은 수강 후 1년 동안 유지되며,
오직 멤버들만을 위한 비공개 스터디클럽, 네트워킹행사, 세미나 등 비정기적 행사에 모실 예정입니다.

image_1@2x
image_2@2x
image_3@2x
image_4@2x
image_5@2x
매주 목요일마다 할인 마감!

수강료 안내

강의 정보, 한 번 더 확인!

기 간 : 2020. 2. 5. ~ 2020. 4. 29 (4/15 휴강)
일 정 : 매주 수요일 19:30 – 22:30 (주 1회 3시간)
준비물 : 개인 노트북(RAM 8G 이상)
장 소 : 패스트캠퍼스 강의장


할인가 153만원
정가 180만원

15% 할인 진행중! (-12/19)

✓ 할인가는 매주 목요일 자정에 변경됩니다.
✓ 카드 12개월 무이자 할부 가능

다음 기수는 언제죠?

이번 기수 수강이 어렵다면
출시알림을 신청해주세요

최저가로 강의를 수강할 수 있게, 다음 기수 홍보 시작 시 가장 먼저 메일을 보내드립니다.

– 계산서 발행을 원하실 경우, 먼저 수강신청을 진행한 후 결제 프로세스를 문의해주시기 바랍니다.
– 수강 인원이 10명 미만인 경우 또는 내부 사정으로 인하여 부득이하게 폐강될 수 있습니다. (자세한 안내는 하단 유의사항 참고바랍니다.)

강의장 안내

학습지원 프로젝트

공부도 하고! 학습지원금도 받고!

*학습지원금(제세공과금 22% 차감 후 지급)은 강의마다 개인마다 상이할 수 있습니다.

학습 목표 1. 학습노트 제출

코스 진행 일정 3일 후(토요일) 24:00까지 학습노트를 작성해 제출해 주세요.

[수강 중 학습 콘텐츠 일정] 학습노트 제출 12회

1회차 제출기한 : 8월 24일(토) 24:00까지
2회차 제출기한 : 8월 31일(토) 24:00까지
3회차 제출기한 : 9월 7일(토) 24:00까지
4회차 제출기한 : 9월 21일(토) 24:00까지
5회차 제출기한 : 10월 5일(토) 24:00까지
6회차 제출기한 : 10월 19일(토) 24:00까지
7회차 제출기한 : 10월 26일(토) 24:00까지
8회차 제출기한 : 11월 2일(토) 24:00까지
9회차 제출기한 : 11월 9일(토) 24:00까지
10회차 제출기한 : 11월 16일(토) 24:00까지
11회차 제출기한 : 11월 23일(토) 24:00까지
12회차 제출기한 : 11월 30일(토) 24:00까지

학습지원금을 받으려면?

미션을 모두 완료하면 신청페이지를 통해 신청 가능합니다.
다만, 강의 종료 후 30일 이내에 신청페이지를 통해서 신청해주셔야 합니다.
아래의 환급신청 링크로 신분증 사본 / 환급받을 통장사본을 제출 (반드시 본인 명의로만 가능)해 주세요.
결제한 수강료의 10% (환급 금액의 22% 제세공과금으로 차감) 를 드리며, 학습지원금은 개인마다 상이할 수 있습니다.

신청페이지 바로가기

환불규정

* 학습지원금은 기수강생 할인만 중복 적용이 가능합니다. (기타 다른 이벤트와 중복 적용이 불가합니다.)
* 과제물이 허위로 작성되거나 표절일 경우 환급이 거절될 수 있습니다.
* 환불은 환불규정(https://www.fastcampus.co.kr/refund/)에 따라 진행됩니다. 규정에 의거하여 환불금액이 없을 수 있습니다.

[ 유의사항 및 환불규정 ]

* 모든 패스트캠퍼스 오프라인 파트타임 교육은 개강 전일 18시에 모집이 마감됩니다.
* 상황에 따라 사전 공지 없이 모집이 조기 마감되거나 할인이 연장될 수 있습니다.
* 수강 인원 확인을 위하여, 즉시 결제가 어려운 경우에도 반드시 수강신청을 먼저 진행해주시기 바랍니다.
* 수강생의 결석이나 지각 등으로 발생한 손해에 대해서는 별도의 보상을 제공하지 않습니다.

* 다음과 같은 사유 등으로 인해 강의가 폐강될 수 있으며, 폐강 시 학원법에 따라 반환 사유 발생일로부터 5 영업일 이내에 수강료를 환불해드립니다.
– 모집된 수강인원이 10명 이하일 경우
– 강사의 갑작스러운 사고 및 건강 상의 이유
– 천재지변
: 위의 사유로 강의가 폐강될 경우, 학원법 제 18조에 따라 오프라인 강의 취소/환불 정책을 준용하여 환불 처리되며, 모객 부진으로 폐강 시에는 최소 개강일로부터 7일 전에는 폐강 여부를 안내해드립니다.

* 총 수강기간 1개월 이내 기준 취소 및 환불 규정 안내
– 환불금액은 정가가 아닌 실제 결제금액을 기준으로 계산됩니다.
– 수업 시작 전 환불 신청 시 전액 환불됩니다.
– 수강 시작 후 환불 신청 시 하기 수업 시수를 기준으로 학원법 환불규정에 따라 환불 가능합니다.
: 환불요청일시 기준 수업시수 1/3 경과 전 : 수강료 2/3 환불
: 환불요청일시 기준 수업시수 1/2 경과 전 : 수강료 1/2 환불
: 환불요청일시 기준 수업시수 1/2 경과 후 : 환불금액 없음

* 기타 환불 관련 안내
– 환불 의사를 밝힌 다음날부터 계산하여 환불합니다.
– 환불금액은 수업시간을 기준(반올림)으로 산정합니다.
– 환불금액의 10원 미만은 절삭합니다.
– 반환 사유 발생 시 5 영업일 이내 환불됩니다.
: PG사와 카드사의 상황에 따라 환불이 지연될 수 있습니다
– 1개월 산정 기준은 민법 제 160조(역에 의한 계산)을 적용합니다.
: 실제 일수와 상관없이 수업시작일이 3월 7일인 경우, 1개월은 4월 6일까지 입니다.
: 단, 수업 시작일이 1월 31일인 경우, 1개월은 월의 말일인 2월 28일까지 입니다.