1) 강의 기간 : 7월 28일 ~ 8월 25일 (주 1회, 총 5주)
2) 강의 시간 : 매 주 토요일 오전 10시 ~ 오후 1시
3) 강의 장소 : 패스트캠퍼스 강의장 (강남역 1분 거리)
4) 문 의 : 윤형진 매니저 (02-517-0641)

Apache Zeppelin에 대해 말하자면!

Spark에서 분석 결과의
시각화 구현이 즉시 가능합니다.

사용자 친화적인 인터페이스를 갖고 있으며, 분석 코드 작성과 실행 그리고 문서화를 한 곳에서 가능하게 해주어 보다 편리한 사용이 가능하죠.

용이한 확장성,
Zeppelin의 가장 큰 장점입니다.

Zeppelin을 사용하게 되면 기술 스택에 관계 없이 자유로운 접근과 분석이 가능하죠. 오픈소스를 기반으로 빅데이터 분석 시스템을 구성하는 기업들은 다양한 기술 스택을 서로 엮어서 시스템을 구성하게 되는데 Zeppelin 하나만 있으면 이들 시스템의 각 요소들에 자유롭게 접근하여 데이터를 다룰수 있게 된 것입니다.

Zeppelin을 활용하면
협업이 편리해집니다.

Spark, Cassandra, MongoDB, Elasticsearch 등 다양한 플랫폼을 지원합니다. 따라서 작업현황 공유도 편리하고, 팀 내에서도 사용자에 따라 권한 설정을 다르게 부여할 수 있는 등 협업에 유용합니다.

Apache Zeppelin, 알고는 있지만 제대로 활용하기는 어렵다?

유연한 확장성에 비해 official document가 부실해요. 

스택의 종류에 관계 없이 Zeppelin에서 통합적으로 데이터 분석을 하고싶은데, 어떻게 해야 할지 모르겠어요.

관련 교육이 없어서 진입 장벽을 넘기가 힘들어요…

Apache Zeppelin 전문가로부터 직접 배우는 단 하나의 교육과정!

1

Zeppelin 커뮤니티 운영진이 알려주는 Apache Zeppelin의 A to Z

2

Zeppelin의 실제 개발자 및 사용자의 입장에서 전달 드리는 사용 노하우

3

국내 최초로 선보이는 Apache Zeppelin 사용자를 위한 실무 교육 과정

Zeppelin은 뛰어난 확장성, 손쉬운 시각화 기능까지 아주 장점이 많은 툴입니다. 후발주자임에도 빠르게 성장할 수 있었던 이유이죠. 다만 오픈소스이기 때문에 공식적인 Documentation 또는 서비스 지원이 상용 프로그램에 비해 부족한 것이 사실입니다. 사용 초기에 진입 장벽이 발생하는 이유이죠. 그래서 기획한 본 강의는 데이터에 따른 Zeppelin 사용 사례와 기술 스텍에 따라 자주 발생하는 여러가지 버그에 대한 내용을 다루어 실무에서 Zeppelin을 사용하는데 도움을 드리고자 합니다. Zeppelin 커뮤니티 운영진이 직접 전하는 Zeppelin 활용법과 생생한 실무 노하우를 모두 얻어가시기 바랍니다. 

– 담당 매니저 윤형진

“Apache Zeppelin의 설치부터 심화 단계까지!
실무에서 반드시 알아야 할 Zeppelin 활용법의 정수를 담은 5주 과정,
지금 시작하세요! “

Apache Zeppelin 전문 강사님을 소개합니다!

류아영님 사진

류아영 님 / Part 1. 강의

2년 전부터 Apache Zeppelin 오픈소스 프로젝트에 끊임없이 contribution하여 2017년 Apache Zeppelin의 PMC(Project Management Committee)가 된 후, 현재는 Apache Zeppelin이 탄생한 ZEPL에서 Zeppelin 기반으로 엔터프라이즈 환경에서 협업에 좀 더 집중한 ZEPL 프로젝트의 프론트엔드 개발자로 일하고있습니다. Apache Zeppelin의 고향에서 2년간 일하며 한국, 미국 그리고 유럽의 Zeppelin 개발자 및 사용자들을 만나보며 들은 경험과 고민들을 강의를 통해 최대한 공유해드리고자 합니다.

[ 약력 ]

– ZEPL Software Development Engineer
– 
Apache Zeppelin 커뮤니티의 성장을 봐온, Apache Zeppelin PMC (Project Management Committee)
– 
숙명여자대학교 컴퓨터과학부 졸업
– 
Github: https://github.com/AhyoungRyu/
– LinkedIn: https://www.linkedin.com/in/AhyoungRyu

김태준님 사진

김태준 님 / Part 2. 강의

2016년부터 Zeppelin, Spark, Hive를 machine Learning, interactive data analysis, text mining, data warehouse 구축, OLAP (OnLine Analytical Processing) 등에 사용해왔습니다. 다수의 행사에서 Zeppelin을 주제로 발표한 경험으로부터 정수를 뽑아 강의에 녹여낼 예정입니다. 이 강의를 통해 Zeppelin이 여러분의 삶을 조금이라도 편하게 만들어줬으면 좋겠습니다 🙂

[ 약력 ]

– 서울시립대학교 데이터마이닝 연구실 석사과정
– 연구 분야: Music Information Retrieval, Machine Learning, Deep Learning
– Spark용 한국어 형태소 분석기 spark-NKP 개발: https://github.com/uosdmlab/spark-nkp
– ‘데이터야놀자’ 준비위원회
– Github: https://github.com/tae-jun
– SlideShare: https://www.slideshare.net/JunKim22

실습 예시

아래 이미지는 Zeppelin으로 시각화 한 분석 결과물입니다.

5주 커리큘럼

Part 1. Apache Zeppelin Environment

1회차 Apache Zeppelin Overview

    • Data science life cycle에서 Apache Zeppelin의 위치 및 역할
    • Apache Zeppelin A to Z
      • Interpreter setting
      • Job management
      • Notebook repositories
      • Credential setting
      • Helium
      • Configurations
    • Hands on Sessions: Notebook versioning, Change notebook repository to AWS S3, Shiro authentication

2회차 Multi-user Environment & Pluggable System in Apache Zeppelin

    • Multi-user environment in Zeppelin
      • Shiro authentication
      • Notebook permission settings
      • Interpreter permission settings
      • Personalized mode
    • Helium: Pluggable System in Zeppelin
      • What is Helium? Why it is proposed?
      • Visualization type Helium package
      • Hands on Sessions: map/ heatmap/ bubble chart 그려보기

Part 2. Data Science with Zeppelin

3회차 Data Visualization with Zeppelin

    • Data Science with Zeppelin
      • Zeppelin은 언제 어디에 사용하는 것이 좋을까?
      • Zeppelin vs. Jupyter
    • Data Visualization Basics
      • 데이터 시각화의 중요성과 개념 잡기
      • [실습] bar/ pie/ line/ scatter chart 그려보기
      • [실습] template을 이용한 dynamic form 생성하기
      • [실습] Sparkdhk Python 데이터 주고 받기
      • [실습] CRON으로 주기적으로 노트 실행하기
      • [실습] REST API로 변수와 함께 노트 실행하기

4회차 EDA(Exploratory Data Analysis) with Zeppelin

    • Kaggle ML and Data Science Survey data를 활용한 EDA
    • [실습] SQL만으로 히스토그램 그리기
      • Grouping 기능 추가하기
    • [실습] 만능 EDA 노트 만들기
      • Twitter bootstrap으로 발전된 UI 만들기
      • Dynamic form 만들기
      • Angular display system

5회차 Machine Learning Visualization with Zeppelin

    • Interactive Data Analysis
      • [실습] Interactive한 연봉 분석 노트 만들기
    • Visualization for Machine Learning
      • [실습] Logistic Regression
      • [실습] 손글씨 인식하는 노트 만들기
      • [실습] Word2Vec Visualization

당신에게 추천합니다!

Spark, SQL, Python 등 스택의 종류에 관계 없이 Zeppelin에서
통합적으로 데이터 분석을 하고자 하는 데이터 분석가

Spark나 Python에서 ‘시각화’를 좀 더 손쉽게 구현하고 싶은 사람

잠시만요!
수강전, 미리 선수 지식을 확인하세요!

✔ Spark 자체에 대한 지식이 없으시더라도, SQL과 Scala에 대한 경험이 있으시면 강의 이해가 수월합니다.

수강료

일반 등록가

80만 원

Apache Zeppelin, Zeppelin and the Apache Zeppelin logo are either registered trademarks or trademarks of the Apache Software Foundation in the United States and/or other countries. No endorsement by The Apache Software Foundation is implied by the use of these marks.