숙명여대 빅데이터센터 연구소장
국민대 빅데이터 경영 MBA과정 겸임교수

장형석 강사님

Apache Hadoop으로 구축하는
분산처리 빅데이터 플랫폼 입문
CAMP.

# Apache Hadoop 수동설치를 통해 빅데이터 플랫폼을 직접 구축합니다.
# 5대 클러스터를 이용한 Hadoop의 분산처리를 경험할 수 있습니다.
# Hive, Presto, HBase, Zookeeper, Elastic Stack등 주요 Hadoop Ecosystem을 배웁니다.

기 간 일 정 장 소 문 의
2019년 1월 10일 ~ 2월 28일
목요일 저녁 7시 30분 ~ 10시 30분 패스트캠퍼스 강남 강의장 윤형진 매니저
tel. 02-517-0697
help-ds@fastcampus.co.kr

현존하는 기술 중 대용량 데이터를
가장 빠른 시간 내에 처리하는
HADOOP.

어디서, 어떻게 배워야 할까?

현존하는 기술 중 대용량 데이터를
가장 빠른 시간 내에 처리하는
HADOOP.

어디서, 어떻게 배워야 할까?

Fastcampus Hadoop 강의 VS 타 기관 Hadoop 강의

데이터 엔지니어링에서 반드시 필요한 기술, Apache Hadoop

최고의 전문가의 강의로 실무에 200% 활용 가능한 실무 노하우 패스트캠퍼스 강의에서 만나보세요.

수강생이 증명하는 국내 최고의 Apache Hadoop 강의.

ssh

5기 수강생 신상훈 님

현재 근무 중인 회사에서도 Hadoop을 쓰고 있습니다. 이 수업을 듣기 전에는 Hadoop이 무엇인지 잘 몰라서 담당 업무를 하시는 엔지니어 분들에게 질문을 하기도 어려웠었죠. 하지만 이 수업을 들으면서 엔지니어 분들과 소통하기가 훨씬 수월해졌어요. 그러다 보니 욕심이 나더라고요. 앞으로 수업에서 배운 내용을 스스로 다시 복습하면서 회사에서 필요한 데이터를 제가 직접 엔지니어링 해보려고 합니다. 

ff

5기 수강생  인터뷰

Hadoop은 제법 어려운 분야이고, 짧은 시간에 많은 내용을 다루었음에도 불구하고 굉장히 체계적으로 이해하기 쉽게 설명해 주셨습니다. 특히 수업시간에 Hadoop 기반의 빅데이터 플랫폼이 어떻게 작동하는지에 대해 직접 시연해 주실 수 있는 강사님은 빅데이터 전문가이신 장형석 강사님뿐이라고 생각합니다.

세 가지 강의 포인트.

플랫폼 구축에 꼭 필요한 Apache Hadoop 수동 설치 A-Z

본 캠프에서는 빅데이터 플랫폼, Hadoop Ecosystem 기술, HDFS, MapReduce를 이해하고 하드웨어나 네트워크 등 실제 빅데이터 플랫폼 설계 방법을 알려드립니다.  Virtual Box를 이용하여 가상머신 생성 및 리눅스 설치 등 실습 환경을 구축하고, 5대의 머신으로 클러스터를 구성하여 분산처리의 작동원리를 깊게 이해시켜드립니다.

HBase, Zookeeper, Elastic Stack 등 주요 Hadoop Ecosystem 학습

SQL On Hadoop 기술을 이해하여 Apache Hive, Presto를 실습하고, 빠른 데이터 분석을 위한 Spark의 기본적인 사용법 및 Hadoop과의 연동까지 모두 담았습니다. 마지막 주차에는 7주간 배운 Hadoop, Hive, Presto, Spark을 이용하여 데이터 적재, 처리, 분석, 웹서비스 제작까지 빅데이터 분석 전과정을 다루는 프로젝트를 수행합니다.

실무에 바로 쓸 수 있는 실습 코드 제공

본 캠프는 실무 전문성과 강의 경험, 컨설팅 경험까지 두루 갖춘 국내 최고의 현업 전문가가 직접 강의를 진행합니다. Hadoop에 입문하시는 분들을 위해 체계적으로 정리된 실습 교안을 제공합니다. 제공되는 코드는 강사님의 노하우가 녹아있어 실무에서 바로 활용하실 수 있으며, 종강 후에도 충분히 스스로 복습할 수 있도록 상세히 정리되어있습니다.

실무 전문성, 강의 경험 그리고 컨설팅 경험까지 두루 갖춘 대한민국 최고의 전문가가 체계적으로 가르쳐주는 Hadoop의 모든 것을 담은 본 강의를 놓치지 마세요!

체계적인 8주 커리큘럼.

Part 1. Hadoop 기초와 빅데이터 플랫폼의 개념 및 설계

1회차: 빅데이터 플랫폼과 하둡 에코시스템(Hadoop Ecosystem) 기술▼

빅데이터 분석의 근간이 되는 빅데이터 플랫폼의 개념을 이해합니다.
데이터 수집, 저장, 처리, 분석에 필요한 다양한 Hadoop Ecosystem을 살펴보고, Hadoop의 기본 작동원리를 배웁니다.

– 빅데이터 플랫폼의 이해
– Hadoop Ecosystem 기술의 이해
– 하둡분산파일시스템(HDFS)의 구현원리
– 하둡맵리듀스(MapReduce)의 이해

2회차: 빅데이터 플랫폼 구축 계획▼

빅데이터 플랫폼의 아키텍처를 알아보고, 이를 바탕으로 실제 빅데이터 플랫폼을 어떻게 설계해야 하는지에 대해 배웁니다.
하드웨어나 네트워크 등 빅데이터 플랫폼을 도입할 때 필요한 것과 고려해야 할 사항들을 살펴봅니다.

– 빅데이터 플랫폼 설계 방안
– H/W와 N/W 인프라 구성 및 설계
– 빅데이터 플랫폼 구축 프로세스와 설치

Part 2. Hadoop을 이용한 빅데이터 플랫폼 구축

3회차: Hadoop Ecosystem 의사모드(Standalone) 설치 (1대)▼

버츄얼 박스(Virtual Box)를 이용하여 가상머신 생성 및 리눅스 CentOS 6.x 32비트 버전 설치 등 실습환경을 구성합니다.
의사모드로 Hadoop Ecosystem을 설치해보고 Hadoop의 기본적인 사용법을 익혀봅니다.

– 가상화 환경, 가상 머신 준비
– Apache Hadoop 기반의 Hadoop Ecosystem 설치
– Hadoop 기본 사용법(하둡 환경설정, 코어 설정, HDFS 설정, MapReduce 2.0 설정, YARN 설정, 하둡 로그 설정 등)

4회차: 완전분산모드(3대, 클러스터) Apache Hadoop 설치 ▼

분산처리에 필요한 리눅스 CentOS 7.x 64비트 버전을 설치하고 리눅스와 Apache Hadoop의 환경설정을 합니다.
다수의 리눅스 가상머신을 복제하여 네트워크 등을 설정하고, 클러스터링한 후 분산처리를 해봅니다.

– 가상머신 복제(3대, 5대) 및 클러스터 설정
– Apache Hadoop 2.X 설치

Part 3. 효율적인 데이터 처리와 분석을 위한 Hadoop Ecosystem

5회차: Hadoop 기반 데이터웨어하우스(DataWareHouse) ▼

Hadoop에는 MPP(Massively Parallel Processing)가 가능한 대용량 DB인 DW가 있습니다. 
이러한 Hadoop 기반 DW에서 SQL을 사용하기 위한 Hive와 Presto를 배웁니다.

– Hadoop에서 SQL을 사용할 수 있게 해주는 Apache Hive의 이해와 실습
– SQL On Hadoop 기술의 이해
– Apache Hive보다 10배 빠른 SQL On Hadoop, Presto의 이해와 실습

6회차: 빠른 데이터 분석을 위한 Spark ▼

기존 Hadoop의 단점들을 보완하는 Spark의 개념 및 아키텍처를 이해합니다.
Spark의 기본적인 사용법과 Hadoop과의 연동방법을 배우고, 이를 통해 분산처리 속도를 극대화합니다.

– Spark vs MapReduce
– Spark 아키텍처의 이해
– Spark 클러스터 모드 설치 및 실습

7회차: 실시간 처리 및 분석 시스템 ▼

실시간 처리와 분석을 위한 Zookeeper, HBase, Elastic Stack의 기본개념을 이해합니다.법과 Hadoop과의 연동방법을 배우고, 이를 통해 분산처리 속도를 극대화합니다.

– 분산환경 조정에 필요한 서비스를 제공하는 분산코디네이터, Zookeeper
– 비정형 데이터 처리(NoSQL)를 위한 컬럼기반 DB, HBase
– 오픈소스 실시간 분석 시스템, Elastic Stack

Part 4. 실전 빅데이터 분석 프로젝트

8회차: Hadoop Ecosystem 기반의 미니 프로젝트 수행 ▼

7주 동안 배운 내용을 바탕으로 Hadoop, Hive, Presto, Spark을 이용하여 데이터를 적재하고 전처리한 후 분석하는 프로젝트를 수행합니다. LAMP(Linux, Apache, MySQL, PHP)를 이용하여 실제 웹 서비스를 구현해보고, 이를 통해 빅데이터 분석이 어떻게 실제 제품으로 만들어지는지 경험합니다.

– 데이터 적재 및 전처리
– SQL On Hadoop을 이용한 데이터 분석(연관규칙분석 등)
– LAMP(Linux, Apache, MySQL, PHP) 웹 서비스 구현

최고의 전문가에게 직접 배우세요.

hadoop23

장형석 강사님

[약력]
현) 숙명여대 빅데이터센터 연구소장
()()국민대 빅데이터 경영 MBA과정 겸임교수
전) 충북대 비즈니스데이터융합학과 겸임교수
전) 닷컴솔루션 대표

[ 저서 ]
1. 하둡완벽가이드 : 데이터의 숨겨진 힘을 끌어내는 최고의 클라우드 컴퓨팅 기술(개정4판) [2017년 3월]
2. 비주얼 컴플렉시티 Visual Complexity : 복잡한 정보를 효과적으로 표현하는 놀라운 시각화 기법 [2016년 3월]
3. 빅데이터 컴퓨팅 기술 [2014년 6월]
4. 실전하둡운용가이드 [2013년 07월]

이런 분에게 추천합니다.

제대로 된 데이터 분석을 위해 데이터 수집 및 전처리 과정을 이해하고 싶은 분

Hadoop 도입을 고려하고 있는 기업 내 빅데이터 분석팀

데이터 엔지니어가 되기 위해 기초를 탄탄히 다지길 원하시는 분

Hadoop에 대해 들어보기는 했으나, 구체적인 작동원리나 설치방법을 모르는 분

제대로 된 데이터 분석을 위해 데이터 수집 및 전처리 과정을 이해하고 싶은 분

Hadoop 도입을 고려하고 있는 기업 내 빅데이터 분석팀

데이터 엔지니어가 되기 위해 기초를 탄탄히 다지길 원하시는 분

Hadoop에 대해 들어보기는 했으나, 구체적인 작동원리나 설치방법을 모르는 분

수강료.

Hadoop 수동설치부터 주요 Ecosystem 까지!

Apache Hadoop으로 구축하는 분산처리 빅데이터 플랫폼 입문 CAMP

일    정 2019.1.10.~ 2019.2.28.
매주 목요일 오후 7:30 ~ 10:30 | 주 1회, 총 8주
준비물 개인 노트북 사용 추천
(본인 PC에 맞는 개발 환경 설정 및 원활한 개별 실습을 위하여)
장    소 강남역 패스트캠퍼스 본원
문    의 윤형진 매니저 : 02-517-0641
궁금하신 사항이 있으면 언제든 연락주세요 🙂

정가 : 140만원

※ 출시알림을 신청하시면 다음 기수 강의정보를 가장 먼저 받아보실 수 있습니다.
※ 할인가는 매주 목요일 자정에 변경됩니다.
※ 카드 12개월 무이자 할부 가능!

출시알림

Apache Hadoop, Hadoop, Apache Spark, Spark, Apache Hive, Hive, the yellow elephant logo, the yellow bee and the orange star logo are either registered trademarks or trademarks of the Apache Software Foundation in the United States and/or other countries. No endorsement by The Apache Software Foundation is implied by the use of these marks.

강의장 안내