courseimg_data_seminar_chatbot-800x452

문의 : 02-518-4822

Do You Want to Make Your Chatbot Smarter?

딥러닝이 자연어처리 분야에 적용되면서 자동 대화 시스템 즉, 챗봇의 발전에 기여하고 있으며, 이에 대한 관심도도 매우 높습니다. 하지만 여전히 챗봇의 상용화까지는 갈 길이 먼 것이 현실입니다. 때문에 구글이나 아마존 챗봇 또한 새로운 모델 개발보다는 기존 챗봇을 고성능화 하는 방향으로 연구가 이뤄지고 있습니다. 이에 발맞춰 이번 [ 2017 챗봇 딥러닝 세미나 ]에서는 데이터의 전처리와 목적에 맞는 Feature 생성법을 이해하고 챗봇의 두뇌인 RNN과 seq2seq를 깊이있게 학습하여, 직접 pytorch로 구현해볼 수 있는 실전형 Session을 준비했습니다.

비즈니스 목적에 맞는
Feature Engineering

일상챗이 아닌 상용화 가능한 챗봇을 만들기 위해서는 비즈니스 목적에 맞는 Feature Engineering이 필요합니다. 본 수업에서는 비즈니스 목적에 맞는 Tokenization – Vectorization – Classification – Answer – Serving으로 이어지는 Python 기반의 파이프라인을 직접 구축합니다.

딥러닝 알고리즘, 텍스트에 얼마나 활용해보셨나요?

각 세부 모듈에 TF-IDF / SVM / CNN / RNN 등의 다양한 모듈을 적용해 보면서 다양한 텍스트 데이터의 형식 및 분량에 대해 적절한 모델을 찾아봅니다. 딥러닝 텍스트 분석에 널리 쓰이는 RNN에 대해서는 External Memory / Attention 등 최신 기술에 집중합니다.

최고 전문가에게 배우는
Pytorch를 활용한 자연어처리

Tensorflow를 사용한 자연어처리는 자료가 많지만, Pytorch를 이용한 자연어처리 자료는 찾기 어렵습니다. 본 세미나는 현 페이스북 PyTorch KR의 운영진인 강사님께서 Pytorch를 활용한 자연어처리의 핵심과 실전 경험을 바탕으로한 생생한 노하우를 전합니다.

커리큘럼

489573

# 안내사항
PyTorch 는 윈도우를 지원하지 않습니다. 윈도우 사용자 분들은 Docker/Virtualbox 등 가상환경을 준비해 오셔야 합니다.
– 수업은 Anaconda Python 3.6으로 진행됩니다. Conda/Virtualenv 등 가상환경을 미리 만들어 오시는 것을 추천드립니다.

# 가상환경 만드는 방법을 모르신다면, 담당 매니저에게 문의 바랍니다.

Windows에 docker 환경 구축하고 Ubuntu & PyTorch 설치하기
http://daddynkidsmakers.blogspot.kr/2017/05/docker.html

Anconda를 이용한 파이썬 가상환경 설정
https://graspthegist.com/post/learn-conda-1/

회차 내용
Day. 1 파이프라인 구축
1 Tokenization => Vectorization => Classification => Serving 으로 이어지는 전반적인 파이프라인을 소개합니다.
1) NLP task 및 한국어/영어 데이터 소개
2) 챗봇의 구성요소

3) 실습: 긍정/부정 감정 분석
– Scikit-Learn / KoNLPy 이용한 Tf-Idf / Random Forest 기반 감정 분류 모델 / 데이터: 네이버 영화 리뷰
4) 실습: 학습시킨 모델을 봇에 연동하기
– Flask 기반의 카카오톡/라인 API
– 참고자료: https://docs.google.com/presentation/d/1Gkc6MKxl-aAqccl3h_qXJ-aCcY6d6mKtse6bKLWHzLk
Day. 2 CNN / RNN 을 이용한 문서 분류
2 고객의 질문에 답하기 위해서는 고객의 의도를 먼저 파악해야 합니다. 딥러닝을 이용한 텍스트 분류 모델을 소개합니다.
1) Word-CNN 이론
2) 실습: CNN 을 이용한 감정 분류 모델 / 데이터: 네이버 영화 리뷰

3) Word-RNN 이론
4) 실습: RNN 을 이용한 감정 분류 모델 / 데이터: 네이버 영화 리뷰
Day. 3 Seq2Seq with Attention
3 정해진 답변이 아닌 문장을 생성하는 모델입니다. Attention은 문장을 생성할 때 어디에 집중해야 할 지를 학습하는 방법입니다.
1) RNN Encoder-Decoder / Attention 이론
2) 실습: Attention Seq2Seq 을 이용한 번역 모델 / 데이터: 한글-영어 (직접 고객 데이터를 준비해 오시는 것을 권장합니다.)
3) 최신 Attention 모델 동향
Day. 4 QA with External Memory
4 RNN 모델은 대화가 길어지면 앞 내용을 잊어버리기에, 기억 용량을 강화해야 합니다.
1) External Memory 이론
2) 실습: End-to-End Memory Networks 로 질의응답/추론 문제 풀기 / 데이터: bAbI
3) 최신 QA 모델 동향
본 워크샵은 이론과 실습을 중심으로 진행됩니다. 실습 후 해당 주제에 대한 페이스북/구글/세일즈포스 등 최신 자연어처리 연구 결과를 소개합니다.

수강 대상

일상챗이 아닌 비즈니스 목적에 맞는 챗봇을 만드는 방법을 알고 싶은 분

RNN / seq2seq을 어느 정도는 이해하지만 기초서적 이상의 내용을 조금 더 자세히 공부하고 싶으신 분

세미나 신청 전 사전지식 체크리스트를 확인하세요!

git clone / wget 으로 주어진 링크에서 기존 코드/데이터를 다운받을 수 있다.

파이썬 가상환경 사용법을 알고 있다.

re 라이브러리로 문서에서 한글 단어만 추출할 수 있다.

KoNLPy 라이브러리로 MeCab 을 이용한 형태소 분석을 할 수 있다.

PyTorch 라이브러리로 CNN 을 이용한 MNIST 이미지 분류 모델을 구현할 수 있다.

PyTorch 라이브러리로 RNN 을 이용한 단어 생성 모델 (Word-RNN) 을 구현할 수 있다.

4개 이상 Yes라고 대답하신다면,
본 세미나를 충분히 이해하실 수 있습니다.

보다 상세한 상담이 필요하시다면,
담당 매니저에게 문의해주세요!

강사 소개

chat

 조재민님

[ 약력 ]
● 서울대학교 산업공학과 재학 중
● 페이스북 그룹 PyTorch KR 운영진
● (전) Data&Ada 자연어처리 연구원
● TensorFlow KR 2nd Meetup 발표자
(주제: ‘Developing Korean Chatbot’)

● Awesome-Korean-NLP GitHub Repo maintainer
https://github.com/datanada/Awesome-Korean-NLP

unnamed (1)

 전인수 조교님

[ 약력 ]

● 서울대학교 – 시각 및 학습 연구실, 박사과정, 딥러닝 및 컴퓨터 비전, 2016 ~ Present
● 서울대학교 – AILAB 연구실, 석사, 기계학습 및 컴퓨터 비전 2013 ~ 2016
● University of California, Los Angeles, 학사, 컴퓨터 공학 전공, 통계학 부전공, Class of 2012

[ Teaching Experience ]

● 2014~2015 기계학습 (Machine Learning) 과목 조교
● 2017 컴퓨터 비전 (Computer Vision) 과목 조교
● 2017 서경대학교 딥러닝 특강
● 2017 서울대학교 4차 산업혁명 아카데미 선행교육 강사 – 선형대수 및 확률, 조합론
● 2017 서울대학교 빅데이터 아카데미 – 빅데이터 엔지니어 과정 – 딥러닝 이론 강의 및 실습

세미나 개요

체크 목록만으로는 사전지식이 어느 정도 필요한지 모르시겠다면, 아래 튜토리얼의 내용을 이해하는 정도인지 확인해주세요.

tutorial 확인하기 (클릭) ]
1. Basics 모든 내용
2. Intermediate 일부 (1,3,4,5 항목)
– Convolutional Neural Network
– Recurrent Neural Network
– Bidirectional Recurrent Neural Network
– Language Model (RNN-LM)

챗봇 개발자를 위한 딥러닝 알고리즘 Workshop
기 간 2017년 9월 13일 ~ 9월 23일 (2주)
일 정 수요일 19:30 ~ 22:30
토요일 10:00 ~ 13:00 (주 2회, 회 당 3시간)
준비물 개인 노트북 권장
장 소 패스트캠퍼스 강의장
담당자 코스매니저 이샘 02-518-4822
help.camp.ds@fastcampus.co.kr

등록가

60만 원

* 출시알림을 신청하시면, 다음 기수 모집 시 가장 먼저 알려드립니다.