Apache Hadoop으로 구축하는

분산처리 빅데이터 플랫폼
입문 CAMP

내 손으로 직접 만드는 빅데이터 플랫폼!
빅데이터 권위자에게 배우는 Hadoop Ecosystem의 정수

#Hadoop_Ecosystem#커스터마이징
#체계적이해

Apache Hadoop으로 구축하는

분산처리 빅데이터 플랫폼 입문 CAMP

내 손으로 직접 만드는 빅데이터 플랫폼!
빅데이터 권위자에게 배우는 Hadoop Ecosystem의 정수

#Hadoop_Ecosystem#커스터마이징#체계적이해

기간 & 일정

2019.7.4. – 8.29.
매주 목요일 19:30 – 22:30
주 1회·8주·총 24시간
(8월 15일 휴강)

장소 & 준비물

패스트캠퍼스 강남강의장
강남역 4번 출구, 미왕빌딩
개인 노트북
* RAM 8GB 이상, 여유 저장 공간 20GB 이상
* Windows 사용자는 64비트 필수

담당자 & 문의

윤형진 매니저
02-517-0641
help-ds@fastcampus.co.kr

빅데이터를 다루는 당신,
혹시 이런 고민하고 계시진 않나요?

빅데이터를 다루는 당신,
혹시 이런 고민하고 계시진 않나요?

왜일까요?

왜일까요?

데이터를 제대로 [분석]하려면 제대로 [준비]할 줄 알아야 하는 법.

데이터의 저장부터 수집·처리까지 탄탄하게!
빅데이터 분석을 위한 기초체력 ‘제대로’ 잡아보세요

데이터를 제대로 [분석]하려면
제대로 [준비]할 줄 알아야 하는 법.

 

데이터의 저장부터 수집, 처리까지 탄탄하게!
빅데이터 분석을 위한 기초체력 ‘제대로’ 잡아보세요

Apache Hadoop?
왜 필요한가요?

하지만
Hadoop 학습에는
진입장벽이 너무 많습니다.

이 강의는
그래서 탄생했습니다

실무에 200% 활용할 현업 노하우를
최고의 전문가에게 배우는 강의!
패스트캠퍼스에서 만나보세요

이 강의는
그래서 탄생했습니다

실무에 200% 활용하는 현업 노하우를
최고의 전문가에게 배우는 강의!
패스트캠퍼스에서 만나보세요

공부도 하고!
학습지원금도 받고!

결제액의 10%를 학습지원금으로 드립니다.

패스트캠퍼스의 수강의지를 강화하기 위한 지원금 제도를 운영합니다
패캠이 제안하는 학습 목표를 달성하고 커리어 이상의 성취감을 얻어가길 바랍니다.

*학습지원금은 제세공과금(22%)을 제하고 드립니다.

과제/학습노트

100% 제출

수강생이 증명하는 국내 최고의 Apache Hadoop 강의.

ssh

5기 수강생 신상훈 님

현재 근무 중인 회사에서도 Hadoop을 쓰고 있습니다. 이 수업을 듣기 전에는 Hadoop이 무엇인지 잘 몰라서 담당 업무를 하시는 엔지니어 분들에게 질문을 하기도 어려웠었죠. 하지만 이 수업을 들으면서 엔지니어 분들과 소통하기가 훨씬 수월해졌어요. 그러다 보니 욕심이 나더라고요. 앞으로 수업에서 배운 내용을 스스로 다시 복습하면서 회사에서 필요한 데이터를 제가 직접 엔지니어링 해보려고 합니다. 

ff

5기 수강생  인터뷰

Hadoop은 제법 어려운 분야이고, 짧은 시간에 많은 내용을 다루었음에도 불구하고 굉장히 체계적으로 이해하기 쉽게 설명해 주셨습니다. 특히 수업시간에 Hadoop 기반의 빅데이터 플랫폼이 어떻게 작동하는지에 대해 직접 시연해 주실 수 있는 강사님은 빅데이터 전문가이신 장형석 강사님뿐이라고 생각합니다.

SE-74cefa1b-79d3-4082-9865-88e8d7c2937a

7기 수강생  조성빈

이 강의는 현재 직접적으로 업무와 연결되어 있는 스파크, 하이브, Glue, Sqoop 등의 데이터 엔지니어링 패키지를 새로 배우고 적용하는 데 큰 도움이 되었습니다. 하둡 에코 시스템에 대한 깊은 이해를 통해서 클라우드 상에서도 서비스를 작동 방식을 이해하게 되었기에 자신감을 가지고 업무에 임할 수 있게 되었어요.

세 가지 강의 포인트.

플랫폼 구축에 꼭 필요한 Apache Hadoop 수동 설치 A-Z

본 캠프에서는 빅데이터 플랫폼, Hadoop Ecosystem 기술, HDFS, MapReduce를 이해하고 하드웨어나 네트워크 등 실제 빅데이터 플랫폼 설계 방법을 알려드립니다.  Virtual Box를 이용하여 가상머신 생성 및 리눅스 설치 등 실습 환경을 구축하고, 5대의 머신으로 클러스터를 구성하여 분산처리의 작동원리를 깊게 이해시켜드립니다.

HBase, Zookeeper, Elastic Stack 등 주요 Hadoop Ecosystem 학습

SQL On Hadoop 기술을 이해하여 Apache Hive, Presto를 실습하고, 빠른 데이터 분석을 위한 Spark의 기본적인 사용법 및 Hadoop과의 연동까지 모두 담았습니다. 마지막 주차에는 7주간 배운 Hadoop, Hive, Presto, Spark을 이용하여 데이터 적재, 처리, 분석, 웹서비스 제작까지 빅데이터 분석 전과정을 다루는 프로젝트를 수행합니다.

실무에 바로 쓸 수 있는 실습 코드 제공

본 캠프는 실무 전문성과 강의 경험, 컨설팅 경험까지 두루 갖춘 국내 최고의 현업 전문가가 직접 강의를 진행합니다. Hadoop에 입문하시는 분들을 위해 체계적으로 정리된 실습 교안을 제공합니다. 제공되는 코드는 강사님의 노하우가 녹아있어 실무에서 바로 활용하실 수 있으며, 종강 후에도 충분히 스스로 복습할 수 있도록 상세히 정리되어있습니다.

실무 전문성, 강의 경험 그리고 컨설팅 경험까지
모두 갖춘 대한민국 최고의 전문가의 체계 잡힌 Hadoop 강의!
 오직 여기에서만 만나보실 수 있습니다!

체계적인 8주 커리큘럼.

Part 1. Hadoop 기초와 빅데이터 플랫폼의 개념 및 설계

1회차: 빅데이터 플랫폼과 하둡 에코시스템(Hadoop Ecosystem) 기술▼

빅데이터 분석의 근간이 되는 빅데이터 플랫폼의 개념을 이해합니다.
데이터 수집, 저장, 처리, 분석에 필요한 다양한 Hadoop Ecosystem을 살펴보고, Hadoop의 기본 작동원리를 배웁니다.

– 빅데이터 플랫폼의 이해
– Hadoop Ecosystem 기술의 이해
– 하둡분산파일시스템(HDFS)의 구현원리
– 하둡맵리듀스(MapReduce)의 이해

2회차: 빅데이터 플랫폼 구축 계획▼

빅데이터 플랫폼의 아키텍처를 알아보고, 이를 바탕으로 실제 빅데이터 플랫폼을 어떻게 설계해야 하는지에 대해 배웁니다.
하드웨어나 네트워크 등 빅데이터 플랫폼을 도입할 때 필요한 것과 고려해야 할 사항들을 살펴봅니다.

– 빅데이터 플랫폼 설계 방안
– H/W와 N/W 인프라 구성 및 설계
– 빅데이터 플랫폼 구축 프로세스와 설치

Part 2. Hadoop을 이용한 빅데이터 플랫폼 구축

3회차: Hadoop Ecosystem 의사모드(Standalone) 설치 (1대)▼

버츄얼 박스(Virtual Box)를 이용하여 가상머신 생성 및 리눅스 CentOS 6.x 32비트 버전 설치 등 실습환경을 구성합니다.
의사모드로 Hadoop Ecosystem을 설치해보고 Hadoop의 기본적인 사용법을 익혀봅니다.

– 가상화 환경, 가상 머신 준비
– Apache Hadoop 기반의 Hadoop Ecosystem 설치
– Hadoop 기본 사용법(하둡 환경설정, 코어 설정, HDFS 설정, MapReduce 2.0 설정, YARN 설정, 하둡 로그 설정 등)

4회차: 완전분산모드(3대, 클러스터) Apache Hadoop 설치 ▼

분산처리에 필요한 리눅스 CentOS 7.x 64비트 버전을 설치하고 리눅스와 Apache Hadoop의 환경설정을 합니다.
다수의 리눅스 가상머신을 복제하여 네트워크 등을 설정하고, 클러스터링한 후 분산처리를 해봅니다.

– 가상머신 복제(3대, 5대) 및 클러스터 설정
– Apache Hadoop 2.X 설치

Part 3. 효율적인 데이터 처리와 분석을 위한 Hadoop Ecosystem

5회차: 빠른 데이터 분석을 위한 Spark ▼

기존 Hadoop의 단점들을 보완하는 Spark의 개념 및 아키텍처를 이해합니다.
Spark의 기본적인 사용법과 Hadoop과의 연동방법을 배우고, 이를 통해 분산처리 속도를 극대화합니다.

– Spark vs MapReduce
– Spark 아키텍처의 이해
– Spark 클러스터 모드 설치 및 실습

6회차: Hadoop 기반 데이터웨어하우스(DataWareHouse) ▼

Hadoop에는 MPP(Massively Parallel Processing)가 가능한 대용량 DB인 DW가 있습니다. 
이러한 Hadoop 기반 DW에서 SQL을 사용하기 위한 Hive와 Presto를 배웁니다.

– Hadoop에서 SQL을 사용할 수 있게 해주는 Apache Hive의 이해와 실습
– SQL On Hadoop 기술의 이해
– Apache Hive보다 10배 빠른 SQL On Hadoop, Presto의 이해와 실습

7회차: 실시간 처리 및 분석 시스템 ▼

실시간 처리와 분석을 위한 Zookeeper, HBase, Elastic Stack의 기본개념을 이해합니다.법과 Hadoop과의 연동방법을 배우고, 이를 통해 분산처리 속도를 극대화합니다.

– 분산환경 조정에 필요한 서비스를 제공하는 분산코디네이터, Zookeeper
– 비정형 데이터 처리(NoSQL)를 위한 컬럼기반 DB, HBase
– 오픈소스 실시간 분석 시스템, Elastic Stack

Part 4. 실전 빅데이터 분석 프로젝트

8회차: Hadoop Ecosystem 기반의 미니 프로젝트 수행 ▼

7주 동안 배운 내용을 바탕으로 Hadoop, Hive, Presto, Spark을 이용하여 데이터를 적재하고 전처리한 후 분석하는 프로젝트를 수행합니다. LAMP(Linux, Apache, MySQL, PHP)를 이용하여 실제 웹 서비스를 구현해보고, 이를 통해 빅데이터 분석이 어떻게 실제 제품으로 만들어지는지 경험합니다.

– 데이터 적재 및 전처리
– SQL On Hadoop을 이용한 데이터 분석(연관규칙분석 등)
– LAMP(Linux, Apache, MySQL, PHP) 웹 서비스 구현

교육과정소개서_cta_mo-1

강의 소개를 한 눈에 보고 싶다면? 교육 과정 소개서를 확인해주세요!
* 본 소개서는 회사 제출용으로도 사용 가능합니다.

최고의 전문가에게 직접 배우세요.

hadoop23

빅데이터 전문가

장형석

[약력]
현) 숙명여대 빅데이터센터 연구소장
국민대 빅데이터 경영 MBA과정 겸임교수
전) 충북대 비즈니스데이터융합학과 겸임교수
전) 닷컴솔루션 대표

[ 저서 ]
1. 하둡완벽가이드 : 데이터의 숨겨진 힘을 끌어내는 최고의 클라우드 컴퓨팅 기술(개정4판)
2. 비주얼 컴플렉시티 Visual Complexity : 복잡한 정보를 효과적으로 표현하는 놀라운 시각화 기법
3. 빅데이터 컴퓨팅 기술
4. 실전하둡운용가이드

이런 분에게 추천합니다.

데이터가 저장/처리/분석 단계를 거쳐 서비스로 만들어지는 전체 프로세스를 이해하고 싶은 데이터 엔지니어/ 데이터 분석가 또는 개발자

데이터 엔지니어로서의 (혹은 데이터 엔지니어가 되기 위해) 기초 체력을 튼튼히 쌓고 싶은 사람

Hadoop 기반의 빅데이터 플랫폼을 ‘내 환경에 맞게’ customized된 설치와 운영이 필요한 데이터 엔지니어

데이터가 저장/처리/분석 단계를 거쳐 서비스로 만들어지는 전체 프로세스를 이해하고 싶은 데이터 엔지니어/ 데이터 분석가 또는 개발자

데이터 엔지니어로서의 (혹은 데이터 엔지니어가 되기 위해) 기초 체력을 튼튼히 쌓고 싶은 사람

Hadoop 기반의 빅데이터 플랫폼을 ‘내 환경에 맞게’ customized된 설치와 운영이 필요한 데이터 엔지니어

{ FASTCAMPUS COMMUNITY MEMBERSHIP }

패스트캠퍼스 오프라인 강의를 수강하셨다면!
별도의 가입절차없이 패스트캠퍼스 커뮤니티 멤버쉽 회원이 됩니다.
커뮤니티 멤버쉽은 수강 후 1년 동안 유지되며,
오직 멤버들만을 위한 비공개 스터디클럽, 네트워킹행사, 세미나 등 비정기적 행사에 모실 예정입니다.

수강안내.

실전 Hadoop Ecosystem의 정수

Apache Hadoop으로 구축하는 분산처리 빅데이터 플랫폼 입문 CAMP

일    정 2019.7.4.~ 2019.8.29.
매주 목요일 오후 7:30 ~ 10:30 | 주 1회, 총 8주
준비물 개인 노트북 사용 추천
(본인 PC에 맞는 개발 환경 설정 및 원활한 개별 실습을 위하여)
장    소 강남역 패스트캠퍼스 본원
문    의 윤형진 매니저 : 02-517-0641
궁금하신 사항이 있으면 언제든 연락주세요 🙂

10% OFF
얼리버드 할인가 [6월 20일 마감]

117만원 정가 : 130만원

※ 할인가는 매주 목요일 자정에 변경됩니다.
※ 카드 12개월 무이자 할부 가능!

수강신청

Apache Hadoop, Hadoop, Apache Spark, Spark, Apache Hive, Hive, the yellow elephant logo, the yellow bee and the orange star logo are either registered trademarks or trademarks of the Apache Software Foundation in the United States and/or other countries. No endorsement by The Apache Software Foundation is implied by the use of these marks.

강의장 안내

학습 지원 프로젝트

공부도 하고! 학습지원금도 받고!

*학습지원금(제세공과금 22% 차감 후 지급)은 강의마다 개인마다 상이할 수 있습니다.

학습 목표. 학습노트 8회 제출

1회차: 7월 7일(일)까지 학습노트 작성 후 제출
2회차: 7월 14일(일)까지 학습노트 작성 후 제출
3회차: 7월 21일(일)까지 학습노트 작성 후 제출
4회차: 7월 28일(일)까지 학습노트 작성 후 제출
5회차: 8월 4일(일)까지 학습노트 작성 후 제출
6회차: 8월 11일(일)까지 학습노트 작성 후 제출
7회차: 8월 25일(일)까지 학습노트 작성 후 제출
8회차: 9월 1일(일)까지 학습노트 작성 후 제출

학습지원금을 받으려면?

미션을 모두 완료하면 신청페이지를 통해 신청 가능합니다.
다만, 강의 종료 후 30일 이내에 신청페이지를 통해서 신청해주셔야 합니다.
아래의 환급신청 링크로 신분증 사본 / 환급받을 통장사본을 제출 (반드시 본인 명의로만 가능)해 주세요.
결제한 수강료의 10% (환급 금액의 22% 제세공과금으로 차감) 를 드리며, 학습지원금은 개인마다 상이할 수 있습니다.

환불규정

* 학습지원금은 기수강생 및 얼리버드 할인과 중복 적용이 가능합니다. (기타 다른 이벤트와 중복 적용이 불가합니다.)
* 과제물이 허위로 작성되거나 표절일 경우 환급이 거절될 수 있습니다.
* 환불은 환불규정(https://www.fastcampus.co.kr/refund/)에 따라 진행됩니다. 규정에 의거하여 환불금액이 없을 수 있습니다.