자연어처리를 위한
딥러닝
CAMP.

# 목표는 NLP를 직접 구현해보는 것 –

# 자연어 처리 기초 + 딥러닝 기법 + PyTorch 활용법, 3가지를 한번에!

기 간 일 정 장 소 준비물 문 의
11월 17일 ~ 12월 22일
(주 1회, 총 6회)
토요일 오후 2시 ~ 5시
(회 당 3시간, 총 18시간)
패스트캠퍼스 강남 강의장 개인 노트북 권장 이샘 매니저 tel. 02-518-4822
help-ds@fastcampus.co.kr

강의 요약.

주제 : 자연어 처리 (Natural Language Processing)

인공지능 분야의 하위 분야로 주로 분류되는 분야로 사람이 사용하는 언어를 기계가 인식할 수 있는 형태로 입력 형식을 바꿔주거나 또는 바뀐 형식을 다시 인간이 이해 할 수 있는 언어로 표현하는 기술을 개발하는 분야입니다.

강의의 최종 목표

1) 자연어처리에 필요한 딥러닝의 주요 모델
2) PyTorch 활용법
3) 자연어처리 구현(Word Embedding, Text Classification 등)
을 익힐 수 있는, 일석삼조의 강의입니다.

본 강의를 수강하고 나면 실제 필드에서 가장 활용도가 높은 기술인 Text Classification을 PyTorch를 활용하여 구현할 수 있습니다.

왜 Text Classification 인가?

Text Classificaion은 실무에서 가장 활용도가 높은 기술입니다. 본 강의에서는 RNN과 CNN을 활용하여 Text Categorization, Sentiment Analysis(감성분석)을 구현할 수 있도록 합니다. 구현 실습은 이어지는 이미지를 참고하세요!

[ 현업에서 활용되는 Text Classification ]

강의 특징.

icon_knowhow

NLP 핵심 개념
완전 정복

자연어 처리의 핵심 개념과 전반적인 연구 동향에 대해 입문자의 눈높이에 맞춰 설명해드립니다. 또한 단어 중의성 해소 및 Word Embedding에 대해 배우고, PyTorch로 직접 구현합니다.

icon_project

핵심 딥러닝 모델
구현 실습

자연어 처리에 최적화된 PyTorch 환결 설정 방법을 가르쳐드립니다. 또한 활용도 높은 딥러닝 모델을 직접 구현해보며, PyTorch 활용법을 체화합니다.

icon_test

다양한 Text Classification
실습

실무에서 가장 활용도가 높은 Text Classification을 활용해 감성분석/언어탐지/주제분류 등을 직접 실습을 통해 배웁니다. 또한 기계번역 및 NLP 분야 전문가가 직접 현업 노하우를 전해드립니다.

커리큘럼.

Part1. 딥러닝과 자연어처리 소개
자연어 처리분야에 대해 소개하고, 딥러닝이 자연어 처리에 사용되는 예시를 함께 살펴봅니다. 또한, 딥러닝의 역사와 기초 이론, PyTorch 활용법을 배워 딥러닝 모델을 만들고 훈련시켜 봅니다.
1회차 이론 -자연어처리 소개 및 어려운 점
-한국어 자연어처리의 난제들
-딥러닝 발전과정 및 현재 사용된 분야
-딥러닝 기초 및 학습과정
-딥러닝 네트워크를 한장의 그림으로 그려보기(비순환 그래프, DAG)
실습 -딥러닝 실습환경 구성하기(python, PyTorch 셋팅하기)
-PyTorch 를 소개하고 Tensor를 조작하는 방법 이해하기
-PyTorch 의 자동 미분법 AutoGrad 알아보기
-카카오 형태소 분석기(Khaiii), 파이썬 패키지(Konlpy) 활용해보기
Part2. 딥러닝, 좀 더 자세히 들여다보기
딥러닝을 조금더 잘 이해하기 위해서 확률과 통계의 기초를 배우고, 딥러닝을 사용해야 하는 이유를 배워봅니다. 또한, PyTroch 프레임워크를 활용해, 선형회귀, 로지스틱 분류 문제를 풀어봅니다.
2회차 이론 -딥러닝을 이해하기 위한 확률과 통계 기초
-왜 자연어처리에 딥러닝을 사용해야 하는가? 왜 딥러닝이 잘 될까?
-머신러닝과 딥러닝의 차이 이해하기
-Feature 추출과 feature 엔지니어링
-딥러닝을 이용한 자연어 처리의 일반적인 프로세스
실습 -PyTorch에서 데이터를 손쉽게 불러오는 도구인 DataLoader 배우기
-PyTorch를 활용하여 뉴럴네트워크 만들기
-Linear regression 문제 풀어보기
-Logistic classification 문제 풀어보기
-학습이 더 잘되게 하는 방법들에 대하여 알아보기
Part3. 컴퓨터가 문장을 처리할 수 있게끔하는 방법 학습하기
문장의 표현(Sentence Representation), 자연어 처리의 프로세스중 제일 기본인 문장을 어떻게 컴퓨터로 하여금 처리할 수 있게 표현할지에 대해 배웁니다. 문장을 분절된 토큰으로 보고, 이들의 표현 방법과 의미를 어떻게 잡아낼지에 대해 공부하여 딥러닝을 활용한 자연어처리를 실습해봅시다.
3회차 이론 -문장을 어떻게 표현할 것인가? 토큰의 의미
-자연어처리의 기본적인 가정 이해하기
-어떻게 단어의 의미를 표현할 것인가? WordNet 프로젝트
-단어의 의미와 유사도: cosine similarity
-전통적인 머신러닝의 방법(tf-idf)과 그 한계(차원의 저주)
-차원의 저주 해결방법 및 차원 축소의 의미
-딥러닝을 이용한 단어 임베딩 기법①
실습 -Word2Vec 알고리즘을 직접 구현해보고 t-SNE 차원 축소 기법으로 그려보기
-Word2vec + Negative Sampling
-Pre-Trained Vectors 사용방법
4회차 이론 -딥러닝을 이용한 단어 임베딩 기법②
-단어 임베딩의 문제점과 그 해결방안: 문자 임베딩
-vocab 에 없는 단어는 어떻게 할까?
-CNN 기초와 Char2Vec
실습 -PyTorch 에서 자연어 처리에 가장 많이 활용되는 TorchText 패키지를 소개 및 활용법 익히기
-미리 훈련된 벡터를 사용하는 방법을 배우기(Field, Iterator, Bucket Iterator, Datasets,Pre-trained Word Vectors)
Part4. 문장를 이해할 수 있도록 도와주는 시퀀셜 모델링(Sequantial Modeling)
자연어 처리에서 문장은 순서가 있는 연속된 토큰들의 조합이라고 가정합니다. 이러한 순서가 있는 데이터를 시퀀셜 데이터라고 하며, 이를 모델링하는 방법들을 배워봅니다.
5회차 이론 -시퀀셜 데이터(Sequential data) 이해하기
-언어모델링의 기초
-과거 머신러닝에서의 언어모델링(N-Gram Modeling)과 그 한계
-Neural N-Gram Language Model( NNLM)
-자연어처리에서 제일 많이 쓴느 딥러닝 모델, Recurrent neural network(RNN)
-LSTM 과 GRU 구조 및 특징
-BiDirectional RNN
실습 -PyTorch 에서 RNN 사용하는 방법
-RNN 을 사용해서 문장 생성하기
-길이가 다른 문장들을 조금더 빨리 처리하는 방법(PackedSequence)
Part5. 실무에서 활용도가 높은, 문장 분류 (Text Classfication)
자연어처리 분야에서 가장 활용도가 높은 text classification에 대해 배우고, PyTorch를 통해 실습 합니다. 다양한 딥러닝 기법을 사용해 문장 분류 문제를 해결해봅니다.
6회차 이론 텍스트 분류 문제를 정의해보고 다양한 방법들을 소개합니다.
- supervised learning
- 머신러닝 방법: Naive Bayesian
- 딥러닝 방법
- CNN과 RNN
실습 -Sentiment Analysis: 네이버 영화댓글 긍정 / 부정 분류기 만들어보기
-News Classification: 로이터 뉴스 카테고리 분류기 만들어보기

추천 대상.

icon_man3_2_happy

현업에서 감성분석, 문서분류 등을 하고 싶은
분석가 및 개발자

icon_man4_2_happy

딥러닝을 활용하여 자연어처리의 기본개념을
이해하고 싶은 분

icon_woman4_2_happy

PyTorch를 활용하여 Text Classification을
구현하고 싶은 분

기본적인 NLP가 아닌 보다 심화된 NLP와 딥러닝 기반의 NLG에 대해 궁금하시다면?.
아래 버튼에 연결된 [ PyTorch를 활용한 자연어처리 심화 CAMP ]를 수강하세요.

강사 소개.

kim

강사 김기현

현재MakinaRocks에서 NLP 딥러닝 연구/개발을 맡고 있습니다. 딥러닝 이전부터 다져온 NLP 관련 경험과 필요성에 대해 이야기하고, 딥러닝과 접목하여 다양한 사례에 적용 및 최신 기계번역을 연구/개발하며 얻은 노하우를 전달하고자 합니다.

[ 약력 ]

– 現 MakinaRocks Machine Learning Research Engineer
– 前 SKPlanet (기계번역 연구/개발)
– 前 Ticketmonster 근무(추천/NLP 연구/개발)
– 前 한국전자통신연구원(ETRI) 전문연구요원 복무(자동통역 연구/개발)
– 한국정보올림피아드(KOI) 수상

nlp2

강사 오상준

딥바이오에서 암 진단 모델을 연구하고 있습니다. 딥러닝에 대한 이론적인 이해와 더불어 실무에서 맞닥뜨리게 되는 다양한 문제들에 대한 공학적인 노하우를 함께 나누고 싶습니다.

[ 약력 ]

– 現 Deep Learning Engineer – Deep Bio
– 병리영상 기반 전립선암 진단모델 연구개발
– GPU 서버 분산 스케쥴링 시스템 개발

– 前 Co-founder, Research Engineer – QuantumSurf
– 해외선물거래 알고리즘을 위한 API 설계 및 UX 개발
– IPTV 영상품질 예측모델 연구개발

강사 인터뷰.

자연어처리를 위한 딥러닝 CAMP를 통해 어떤 내용을 중점적으로 전달할 예정이신가요?

김기현 강사님 : 사실 자연어처리 심화 CAMP를 운영하며 느낀점은, 심화과정을 가르치기에는 모두가 같은 컨센서스를 갖고 있지 않다는 것이었습니다. 아마도 많은 분들이 이미 인터넷이나 각자 공부를 통해서 딥러닝과 기계학습에 대한 지식을 쌓고 계시겠지만, (특히, 자연어처리 분야를 비롯하여) 체계적으로 공부 할 수 있는 자료가 부족하다보니, 각 개인의 관심사에 따라서 부분 별 지식 및 실력의 편차가 매우 큰 것을 느꼈습니다. 따라서, 좀 더 깊은 자연어처리 공부를 할 수 있도록 하는 밑거름이 되도록 체계적인 수업을 진행하여 수강생 여러분을 도와드릴 수 있으면 좋겠습니다.

오상준 강사님 : 기존에 직접 연구를 진행해보지 않으신 분들은, 기본적인 환경 구성에서부터 고생하시는 경우를 많이 보았습니다. 이번 입문반에서는 최소한의 허들을 설정하여, 다양한 배경의 수강생분들께서도 환경 구성부터 실무 적용까지, 아주 기초적인 부분부터 차근차근 따라오실 수 있도록 준비했습니다.

기존의 PyTorch를 활용한 자연어처리 심화 CAMP와는 어떤 차이점이 있는지 구체적인 설명부탁드립니다.

김기현 강사님 : 심화 캠프는 말 그대로 심화과정이기 때문에, 자연어처리를 다루기 위한 기초적인 부분은 이미 알고있다고 가정하고 넘어가는 부분이 많습니다. (예를 들어 RNN이나 CNN을 통해 text classification 정도는 구현 해 보고, 고민 해봤으며, bi-directional LSTM과 같은 advanced한 모델에 대해서도 알고 있다고 가정 합니다.) 따라서, 혼자 공부할 준비가 되어 있지 않거나 방법을 모르는 분들의 경우에는, 강의 중 모르는 부분이 나왔을 때 따라오기 벅찰 수 있다고 생각 합니다.

그리고 사실 실무에서는 text classification과 같은 기술들이 더 활용도가 높을 수 있지만, 심화과정은 자연어 생성(natural language generation)에 집중하기 때문에, 기타 자연어 처리 전반에 대해서는 다루지 않습니다. 따라서 이미 자연어처리에 대해서 지식과 경험이 있는 분들이 수강하시는 것을 추천 합니다.
입문 캠프는 지난 심화과정 수업을 진행 할 때에, 자연어처리 및 딥러닝 전반을 배우고자 하는 니즈를 느꼈기 때문에 개설하였고, 이 수업을 듣고나면 심화과정 캠프를 수강해도 되도록 커리큘럼을 제작하였습니다. 혹시 추후 자연어처리 심화과정을 듣고자 하는 입문자들에게는 더 큰 도움이 될 것이라 생각 합니다.

강의 커리큘럼에 대한 전반적인 설명 부탁드립니다.

오상준 강사님 : 이번 강의는 크게 세 개의 파트로 나뉘어 진행됩니다. 첫 번째 파트인 기초 학습에서는 PyTorch 연구 환경을 직접 준비하는 것부터 시작하여, 실습을 통해 PyTorch에 구현된 딥러닝의 기초 개념들을 살펴봅니다. 두 번째 파트에서는 딥러닝 이전의 기존 패러다임에서 사용되던 툴들을 활용해보며 자연어처리의 발전 과정을 되돌아봅니다. 마지막 세 번째 파트에서는 지난 4주간의 내용들을 종합하여, 직접 PyTorch로 text classification 모델을 구현하고 준비된 데이터셋에 학습시켜 실무 상황에 적용해봅니다.

수강대상은 어떤 분들이 좋을까요?

김기현 강사님 : 딥러닝을 배우고 싶거나, 간단히 다루어보았지만 깊이있게 어디서부터 공부해야 할 지 모르겠는 분들. 특히 자연어처리 쪽으로 지식과 경험을 쌓고 싶으신 분들이 이 수업을 들으면 좋을 것 같습니다. 사실 인터넷을 비롯하여 시중에는 딥러닝을 활용한 자연어처리를 기초부터 차근차근 체계적으로 배울 수 있는 방법이 거의 없으므로, 좋은 기회가 될 것이라 생각 됩니다. 수강생 분들은 Python과 기초적인 수학지식(미적분, 확률/통계, 행렬)이 있으면 수강에 어려움이 없으리라 생각 됩니다.

마지막으로 자연어처리를 위한 딥러닝 CAMP에 관심을 가지고 계신 분들에게 한말씀 부탁드립니다.

김기현 강사님 : 저도 한때는 참고자료가 부족한 자연어처리 분야에 대해서 맨땅에 헤딩하며 공부하였고, 그로인해 부족함을 느끼며 지식에 목 마르던 지난날이 있었습니다. 그때 느꼈던 어려움들과 차근차근 공부하며 얻어온 인사이트들을 공유하며 수강생 분들을 조금이라도 지름길로 이끌어드리고 싶고, 좋은 동기부여의 기회가 되면 좋을 것 같습니다.

오상준 강사님 : 학부 전공과는 전혀 다른 일로 넘어오면서 더 절실히 느낀 점은, 멀리 나아가기 위해서는 탄탄한 기본기가 중요하다는 사실입니다. 인터넷에 공부할 자료가 넘쳐나는 세상이지만, 부디 처음 시작은 마음껏 물어보고 따라할 수 있는 환경에서 함께하시어 앞으로 더욱 성장해나갈 굳건한 밑바탕을 얻어가셨으면 좋겠습니다.

수강 전에 꼭 확인하세요!

본 강의는 Python에 기반을 둔 딥러닝 라이브러리 PyTorch로 진행되기 때문에
기초적인 선수지식을 가지고 계신 상태에서 수강하실 것을 권장 드립니다.
아래 항목 중 1개 이상 yes라고 답하실 수 있어야, 수강에 어려움이 없습니다.

1) Python을 활용하여 코딩 경험이 있다.

2) 기본적인 딥러닝 이론을 접해 본 적이 있다.

수강료 안내.

Text classification을 직접 구현하라!

자연어처리를 위한 딥러닝 CAMP

일    정 2018.11.17.~ 2018.12.22.
매주 토요일 14:00 ~ 17:00 | 총 6회
준비물 개인 노트북 사용 추천
(본인 PC에 맞는 개발 환경 설정 및 원활한 개별 실습을 위하여)
장    소 강남역 4번출구 부근
문    의 이샘 매니저 : 02-518-4822
궁금하신 사항이 있으면 언제든 연락주세요 🙂

일반 등록가 : 100만 원

결제일을 기준으로 할인가적용 및 수강이 확정됩니다.

※ 일반 할인가는 매주 목요일 자정에 변경됩니다.
※ 카드 12개월 무이자 할부 가능!

출시알림 신청하기

강의 장소.