텍스트 분석을 위한

머신러닝 CAMP

기존의 머신러닝 지식을 텍스트 분석으로 확장시켜
분석 알고리즘 개발을 위한 기초를 다져가세요!

#머신러닝#알고리즘기반
#텍스트적용

기간 & 일정

2019.04.20 – 06.22 
(5/4, 6/8 휴강)

매주 토요일 14:00 – 17:00
주 1회, 총 24시간

장소 & 준비물

패스트캠퍼스
강남강의장
강남역 4번 출구, 미왕빌딩
개인 노트북

담당자 & 문의

윤형진 매니저
02-517-0641
help-ds@fastcampus.co.kr

강의 목표.

Python과 Machine Learning, 텍스트 분석에 적용을!

지금까지 수치형
데이터로 접근해왔던 머신러닝,
텍스트 데이터에도 적용이 가능하다는
사실을 알고계시나요?

당신이 가지고 있는
파이썬과 머신러닝에 대한 지식
이제, ‘텍스트 분석’으로 확장시키세요!

머신러닝 알고리즘의 도움을 받는다면,
방대한 양의 텍스트 데이터도
빠르고 효율적으로 분석할 수 있으니까요.

강의 특징.

#머신러닝_알고리즘에_기반한_텍스트분석의_모든것

1

당신의
머신러닝 지식,
텍스트 분석으로
확장을!

본 강의는 여러분이 가지고 있는 머신러닝에 대한 지식을 텍스트 분석으로 확장시킬 수 있는, 그 발판이 되는 강의입니다. 머신러닝의 주요 알고리즘인 Classification, Regression, Naive Bayes, SVM(Support Vector Machine) 등의 작동 원리를 이해하고, 텍스트 분석을 위한 머신러닝 활용법을 익혀가세요.

2

일상에서
접할 수 있는
텍스트 데이터로
실습을!

본 강의에서는 네이버 영화, 뉴스, 청와대 국민 청원 등 일상에서 실제로 접할 수 있는 텍스트 데이터를 기반으로 실습을 진행합니다. 실습을 통해 머신러닝 알고리즘 기반으로 완성되어 있는 텍스트 분석을 위한 라이브러리의 사용법을 익히고, 단어/명사 추출, 품사 판별, 키워드 추출, 키워드/ 연관어 분석 등을 스스로 구현해보세요.

3

soynlp
라이브러리를
개발한 강사님께
직접 노하우를!

한국어 텍스트 분석을 위한 soynlp 라이브러리 개발, Pycon 발표, 텍스트 분석 관련 강의 등 많은 지식과 경험을 보유한 강사님께 직접 그 노하우를 전수 받아가세요. 강사님의 노련한 솜씨로 추후 본인의 텍스트 데이터 특성에 맞는 분석 알고리즘 개발을 위한 기초까지 탄탄하게 쌓아가실 수 있습니다.

추천 대상.

머신러닝 알고리즘에 기반한
텍스트 분석을 배우고 싶으신 분”

커리큘럼.

이론과 실습을 병행하는 8주 커리큘럼을 경험해보세요!

1회차 데이터 수집과 토크나이징

– BeautifulSoup을 이용한 데이터 수집: 네이버 영화, 네이버 뉴스
– KoNLPy와 soynlp를 이용한 Bag of Words 만들기

2회차 문서 분류 (Classifier)

– Logistic Regression, Naive Bayes, Support Vector Machine
– Decision Tree, XGBoost

3회차 Embedding을 통한 텍스트 데이터 시각화

– Word2Vec, Doc2Vex, t-SNE, PCA

4회차 Topic Modeling을 통한 유사 문서 탐색

– LSI, LDA, NMF를 이용한 문서의 토픽 표현
– 시각화를 통한 토픽 탐색

5회차 연관어/ 키워드 분석

– Co-occurrence를 이용한 연관어 추출
– Graph Similarity를 이용한 토픽 유사어 추출
– Classifiers를 이용한 키워드 추출
– Graph Ranking(TextRank, KR-WordRank)를 이용한 키워드 추출

6회차 문서 군집(Clustering)

– k-means를 이용한 문서 군집화
– Cluster labeling과 시각화를 통한 군집화 결과 해석

7회차 Named Entity Recognition

– Conditional Random Field(CRF)
– CRF를 이용한 NER 모델 만들기
– Edit Distance를 이용한 오탈자 교정

8회차 Review & 텍스트 데이터 분석 사례 실습

파이썬으로 어떤 실습을 해볼 수 있나요?

어제도 본, 내일도 볼 이런 텍스트 데이터!

영화 데이터 분석

– 영화 데이터(네이버 영화, IMDb)를
기반으로 한 유사 영화 탐색
– 시기 별 영화 장르 분포 변화
– 유사 영화 기반 영화 추천

뉴스 데이터 분석

– 뉴스에서 인명 사전 구축하기(NER)
– 일자 별 핵심 뉴스 파악
– 핵심 뉴스 별 연관어/ 키워드 추출
– 핵심 뉴스 별 핵심 댓글 시각화

청와대 국민 청원

– 데이터 수집
– 시기 별 주요 청원 이슈 시각화

8주 후, 당신은.

머신러닝에 기반한 텍스트 분석? 문제 없습니다.

본 강의를 완벽하게 마스터한
당신의 다음 목적지는?

[자연어 처리를 위한 머신러닝 CAMP]
바로가기

강사 소개.

오랜 기간 패스트캠퍼스와 환상의 호흡을
맞춰온 김현중 강사님! 믿고 따라오세요!
dtm-200x200

김현중 강사님

[약력]
-서울대학교 산업공학과 데이터마이닝 연구실 박사과정
-한국어 텍스트 분석을 위한 soynlp 라이브러리 개발
-PYCON KOREA 2017 ‘노가다 없는 텍스트 분석을 위한 한국어 NLP’ 발표

내 수준에 맞는 텍스트 분석 강의! 잘 모르겠다면?

아래의 관련 강의 정보 및 수강생 선수 지식을 확인해보세요!

학습 경험이 있는 머신러닝 알고리즘을 기반으로 단어/명사 추출, 품사 판별, 키워드 추출, 연관어 분석 등 텍스트 분석으로 확장하는 강의

강의 자세히 보기

RNN과 CNN을 활용하여 Sentiment Analysis, Language Detection, Topic Classification 등의 문서 분류를 구현하는 강의

강의 자세히 보기

주어진 텍스트 데이터로부터 문장을 생성하는 NLG(Natural Language Generation)를 기반으로 상품화가 가능한 수준의 자연어 처리 역량을 기르는 강의

강의 자세히 보기

머신러닝 알고리즘의 응용을 통해 데이터 특성에 맞는 알고리즘 개발. 즉, 자연어 처리를 위한 toolkit을 직접 개발할 수 있는 역량을 기르는 강의

강의 자세히 보기

수강료 안내

정가:130만 원

# 할인가는 매주 목요일 자정에 변경됩니다.
# 할인가 적용 및 수강 확정은 결제일을 기준으로 합니다.

강의장 안내