모집 마김되었습니다.

이번 기수 모집 마김되었습니다.
다음 기수 출시알림을 신청해주세요.

자연어처리를 활용한

추천시스템 입문
Workshop.


2018년 10월 11일 ~
11월 8일

(주 1회, 총 5회)

매 주 목요일
저녁 7시 30분 ~ 10시 30분
(회 당 3시간, 총 15시간)


패스트캠퍼스
강남 본원
(강남역 4번 출구 1분 거리)


문의
02-517-0697
help-ds@fastcampus.co.kr
카카오톡(click)

워크샵
기획 의도.

“자연어처리 기법”은
추천시스템과 매우 밀접한 관련성을 갖고 있다.

텍스트 데이터를 수치로 변환하는 방법이나 고객이나 상품을 분류하는데 사용되는 분류기법이 모두 자연어처리 기법에 그 뿌리를 두고 있기 때문입니다. 따라서 추천시스템의 구현에 있어서 자연어처리 기법을 이해하는 것은 필수적이라고 할 수 있습니다.

하지만, 이러한 추천시스템을 제대로 이해하기엔 여러가지 어려움이 많습니다.

등장한지 얼마 안된 분야이기 때문에 관련 서적이나 강의가 거의 없다.

체계적으로 정리된 추천시스템 관련 자료가 부족하다.

실무에서 추천시스템이 어떻게 구현되는지에 대한 아키텍처(데이터 수집부터 알고리즘 적용, 결과물 출력 등 일련의 과정을 위한 전체적인 설계)를 다루는 자료가 적다.

워크샵
목표.

추천 알고리즘에 대한 체계적 이해하고,
텍스트 데이터를 기반으로 하는 추천시스템을 구현하는 것

본 워크샵은 추천시스템의 알고리즘에 대한 이론들을 체계적으로 정리해주고 이를 파이썬으로 구현하는 과정을 통해 실무에서 추천시스템을 구현하는데 도움을 주는 것을 그 목적으로 합니다.

icon_knowhow

추천시스템 관련 알고리즘을
체계적으로 정리하는 워크샵

추천시스템 구현을 위해 필요한 과정을
어떻게 설계해야하는지
즉, 추천시스템 아키텍처에 대한 이해를 돕고
비즈니스 모델에 적용하기위한 인사이트 전합니다.

icon_project

자연어 처리 기반의 추천시스템
직접 구현해보는 워크샵

추천시스템에 사용되는
자연어처리의 핵심 이론을 배우고 실습하고,
다양한 분류기법이 어떻게 추천에 사용될 수 있는지
실제 예제를 통해 학습합니다.

icon_test

실제 서비스 되고 있는 사례에 대해
분석해주는 워크샵

학습용 데이터가 아닌
실제 데이터를 이용하여 추천시스템을 구축할 때에
중요하게 고려해야 할 부분에 대해
사례를 통해 알아봅니다.

워크샵
강사 소개.

jts

정태승님

[ 약력 ]
– 現 텍스트팩토리 재직(NLU System, Recommender System)
– 경희대학교 컴퓨터공학과 졸업

경희대학교에서 컴퓨터공학을 전공한 후 웹개발자로 경력을 쌓고 현재 챗봇 전문 스타트업 (주) 텍스트팩토리에서 Natural Language Understanding과 Recommender System을 연구/개발하고 있습니다. 사용자 데이터 분석경험, 법률시스템사례추천/변호사추천 시스템을 구축한 경험, 적용사례 및 적용과정에서의 에로사항들을 기반으로 추천시스템의 전반적 내용과 기술적 부분 뿐 아니라 실제 구축에 필요한 인사이트도 함께 제공해 드리겠습니다.

워크샵
커리큘럼.

Part 1. 추천시스템 기초와 기본 알고리즘 (1-2주차)

추천시스템의 기초
추천시스템을 구축하기 위해 필요한 기초 이론과 배경지식을 살펴봅니다.
또한 추천을 위해 구축된 모델의 성능을 평가하기위한 지표와 방법에 대해 알아봅니다.

이론
1) 추천시스템 Overview
2) 추천시스템 역사 & 배경
3) Prediction & Recommendation
4) 추천시스템의 분류
– 개인화레벨별 분류(Personalization level)
– 알고리즘별 분류(Contents Based Filtering, Collaborative Filtering, Product Association Recommender)
5) 성능평가(Evaluation)
– RMSE
– MAE
– etc

실습
실습환경 구축
– Jupyter 환경설치
– 데이터셋 다운로드
– Dataset 탐색적 자료 분석(EDA)
– Product association recommender

 

추천시스템 기본 알고리즘
대표적인 추천시스템 알고리즘인 Contents Based Filtering, Collaborative Filtering의 이론적인 내용과 이를 구현하기 위한 수학적 배경을 학습하고 실습합니다. 실습을 위해 추천에 사용되는 Data의 종류와 Profiling 기법도 함께 알아봅니다.

이론
1) 추천을 위한 데이터
– Type of data
– Noise
– Metrics
– Profiling
2) 추천시스템을 위한 수학적 기법
– TF-IDF
– Similarity
– Distance
3) CBF(Contents Based Filtering)와 CF(Collaborative Filtering)
– CBF와 CF의 개념
– 각 알고리즘의 장점과 단점
4) Matrix Factorization

실습
: 실제 추천기법 구현 실습
1) Contents Based Recommendation 실습
– Movie lens 평점데이터를 이용하여 유사한 컨텐츠를 분류하고, 해당 분류를 통한 추천알고리즘 구현
2) Collaborative Filtering 실습
– Movie lens 평점데이터를 이용하여 User profile을 작성, 프로필 기반으로 비슷한 사용자가 본 영화추천알고리즘 구현

Part 2. 자연어처리의 기초와 자연어처리 기반 추천시스템 (3-4주차)

자연어처리의 기초
추천시스템에 사용되는 기본적인 자연어처리에 대한 내용을 배웁니다.
다양한 자연어처리 기법 중 추천시스템에 사용되는 자연어처리의 핵심 이론을 배우고 실습합니다.

이론
1) 접근기법에 NLP따른 분류
– Rule based approach
– 확률모델
– DeepLearning
2) Text preprocessing
– Part of speechs
– Tokenizing
3) Word embedding
– Bag of word
– TF-IDF
– Distributed representation
4) Text Classification
– Sentimental classification
– Spam filtering

실습
:자연어처리 기초실습
1) 네이버 영화평점 코퍼스 다운
2) 파이썬 NLP Library 소개
– gensim
– NLTK
– Mecab
– etc
3) Tokenizing 실습(NLTK)

 

자연어기반 추천시스템을 위한 모델
자연어 기반 추천시스템을 작성할 때 Item, User Profiling에 사용될 수 있는 Classification의 여러가지 통계/기계학습/머신러닝 모델에 대해 살펴보고 해당 분류기법이 어떻게 추천에 사용될 수 있는지 실제 예제를 통해 학습합니다.

이론
1) Classification model
– Logistic regression
– SVM
– LDA
2) Neural Network for NLP
– LSTM
– CNN

실습
:추천시스템 구현을 위한 자연어처리 기반 분류모델
– 네이버 영화리뷰 코퍼스를 이용한 긍/부정 분류모델 작성 실습
– 텍스트 데이터 Topic 분류모델 작성 실습
– 실무사례 : 현업 자연어 분류모델 동작시연

Part 3. 추천시스템의 아키텍처 등 실제 구현사례와 연구동향 (5주차)

잘 정제된 학습용 데이터나 토이 데이터가 아닌 실제 데이터를 이용하여 추천시스템을 구축할 때에 중요하게 고려해야 할 부분들에 대해 실제 구축사례를 바탕으로 알아보고, 실제 추천시스템 구축상의 어려운 점 및 애로사항을 살펴봅니다. 마지막으로 최근 추천시스템의 연구동향과 딥러닝과의 결합방안에 대해서 배워봅니다.

이론
1) 실제 구현 시 고려사항들
– Logging
– EDA
– Profile define
– 성능측정을 위한 Baseline 설정, 시각화, 대시보드
– Data pipeline
2) 추천시스템과 텍스트분류모델과의 결합방안
3) 검색엔진 활용방안
4) Deeplearning based RS 동향(https://arxiv.org/abs/1707.07435)

[강의 자료 예시] 실제 추천시스템에 사용된 데이터 파이프라인 아키텍처

수강료
안 내.

모집 마감되었습니다.

  • 출시알림 신청하기
  • 강의 장소
    안 내.