학습목표를 끝까지 달성하고
결제액의 최대 20% 학습지원금을 받아가세요!

모집마감

기 간 2019.05.09 ~ 07.18 (총 10회, 6/6 현충일 휴강)
일 정 목요일 PM 7:30 ~ 10:30 (주 1회, 회 당 3시간)
장 소 패스트캠퍼스 강남 강의장
담당자 윤형진 매니저 02-517-0641
help-ds@fastcampus.co.kr

한국어 텍스트마이닝을
체계적으로 배울 수 있는 곳을 찾는 당신에게

국내 최고의 강의를 소개합니다.

어려운 텍스트 분석, 어떻게 배워야 할까?

텍스트 데이터, 왜 분석이 어려운가?

텍스트는 수치 데이터에 비해 분석이 어렵습니다. 그 이유는 인간의 언어가 프로그램 코드처럼 분명하고 정교한 문법으로 표현되지 않기 때문이죠. 특히, 한국어는 그 구조의 복잡도가 높아 분석하기 까다롭습니다. 때문에, 언어학적인 이해와 분석 알고리즘에 대한 지식을 모두 갖추어야 제대로된 분석이 가능합니다. 하지만, 이 모든 것을 다루는 강의는 없었습니다.

[언어학 + 알고리즘] 모두 다루는 국내유일의 커리큘럼

본 CAMP는 언어학자이자, 국내 최고의 텍스트 분석 전문가인 강사님의 직강으로 진행됩니다. 단순히 코딩을 따라치고 결과만 확인하는 강의가 아닙니다. 총 10주간 한국어의 언어적 특성부터 다양한 분석 알고리즘, 그리고 이를 구현하기위한 파이썬 코드까지 체계적으로 가르쳐드리는 강의입니다. 그 어디에서도 볼 수 없던 최고의 커리큘럼을 경험하세요!

공부도 하고!
학습지원금도 받고!

결제액의 10%를 학습지원금으로 드립니다.

패스트캠퍼스의 수강의지를 강화하기 위한 지원금 제도를 운영합니다
패캠이 제안하는 학습 목표를 달성하고 커리어 이상의 성취감을 얻어가길 바랍니다.

*학습지원금은 제세공과금(22%)을 제하고 드립니다.

과제/학습노트

100% 제출

텍스트 분석의 정수를 배우세요!

한국어의 언어적 특성

텍스트 분석 알고리즘

텍스트 분석에 필요한 파이썬 코딩

한국어 텍스트 분석을 위한 3step 강의

텍스트 분석의 활용 범위는 무궁무진합니다. 하지만, 유의미한 결과를 도출하고 인사이트를 찾기 위해서는 텍스트마이닝에 대한 깊이 있는 이해가 필요합니다. 본 캠프에서는 텍스트 분석에 앞서 알아야할 한국어의 언어적 특성에 대해 차근차근 알려드립니다. 이를 기반으로 분류, 군집, 감성 분석 등 다양한 알고리즘을 다뤄, 텍스트가 목적에 따라 어떻게 분석될 수 있는지를 학습합니다. 필요한 파이썬 코드도 다루기 때문에 ‘구현’ 역량까지 기르실 수 있습니다. 

1:1 밀착 지도를 위한 조교 시스템

강의 내용을 빠짐없이 소화할 수 있도록 조교님이 강의에 참여합니다. 특히, 파이썬 코딩 파트에 도움이 필요하면, 언제든 손을 들고 조교님을 부르세요. 수강생 한분 한분 모르는 부분을 해결할 때 까지 조교님이 친절히 가르쳐드립니다.

텍스트마이닝 실무 사례 특강

강의 중간에 현재 텍스트 데이터 엔지니어로 일하고 있는 실무자의 텍스트 분석 활용 사례 특강이 있습니다. 현업에서 텍스트 마이닝이 어떻게 활용되는지 살펴보며, 평소 궁금했던 점을 마음껏 질문하는 기회가 될 것 입니다.

당신에게 추천합니다

연구나 논문 작성에 텍스트 데이터 분석을
적용하고 싶은 연구자

한국어 데이터에 텍스트 마이닝을 적용하기 위해서는 프로그래밍 기법 뿐만 아니라 형태소 분석 등 자연어 처리 이론을 전반적으로 이해해야 합니다. 텍스트 마이닝을 통해 구현 가능한 DB 상에서의 문서 분류, 신문/ 논문/ 보고서 요약, 키워드/ 토픽 추출, 대규모 문서에서의 등을 통해 연구의 질을 향상시킬 수 있습니다. 

텍스트 데이터가 많은 기업에서
텍스트 마이닝을 적용하고 싶은 분석가 

매출과 영업이익에서는 드러나지 않았던 새로운 인사이트를 발굴할 수 있습니다. 지금까지 분석되지 않은 채로 쌓여있는 방대한 양의 텍스트 데이터를 한데 모아 하나의 시각화 된 인사이트로 분석 결과를 얻고 싶은 분. 언론사, 블로그 포스팅을 기반으로 한 홍보 채널, 후기 콘텐츠 분석이 중요한 상품을 분석하세요.

본 캠프는 파이썬을 사용하여 텍스트 데이터 분석을 진행하고 있습니다. 아래 질문에 답하고 캠프를 수강해도 괜찮을지 체크해보세요!

파이썬을 실행해 본 적이 있다.

파이썬에서 list, tuple, dictionary가 무슨 의미인지 알고 있다.

조건문(if)이나 반복문(for, while)이 어떻게 구성되는 개념인지 알고 있다.

파이썬에서 def가 무엇을 위한 명령어인지 알고 있다.

파이썬 스크립트를 읽어 보면 무슨 의미인지 어느 정도 해석할 수 있다.

위 질문에 3개 이상 YES라고 답하셨다면
본 캠프를 수강하셔도 좋습니다.

위 질문에 3개 이상 NO라고 답하셨다면
자세한 상담을 위해 “반드시” 코스매니저에게 연락해주세요!

텍스트 마이닝 전문 강사님을 소개합니다

data_camp_tm_speaker

다음소프트 이사/ 텍스트 처리 전문가 이기황 박사님


텍스트 마이닝 분야의 전문가이신 이기황 박사님은 다음소프트에서 소셜 빅데이터 분석 관련 연구와 개발을 수행하고 있습니다. 영국 에든버러 대학교 전산언어학 및 언어공학 박사이시며, 연세대학교 언어정보연구원 HK 연구 교수로 지내셨습니다. 여러 대학교에서 전산언어학, 텍스트 마이닝, 그리고 디지털 인문학관련 과목 강의를 진행하셨습니다. 대규모 텍스트 및 언어 자료에 기반한 다수의 연구에 참여한 경험이 있습니다.

FMST

실습 조교/다음소프트 텍스트 데이터 엔지니어 김주영님


현재 다음소프트에서 텍스트 데이터를 분석하고 전달하는 일을 하고 있습니다. 매 수업시간마다 진행되는 실습 과정에서 수업을 따라가실 수 있도록 1:1로 옆에서 친절하게 도와드립니다. 수업을 못따라가는 수강생들을 중간중간 모아서 계속 도움을 주시면서 강의를 서포트해드립니다.

체계적인 10주 커리큘럼

주차 학습 목표 및 세부 내용
텍스트 마이닝을 위한 환경 구축과 데이터 전처리
1 텍스트 마이닝의 개관과 작업 환경 구축
- 텍스트 마이닝의 개괄적인 이해
- 작업 환경 구축
- Jupyter Notebook을 이용한 텍스트 처리
2 텍스트 데이터의 전처리 1: 수집과 저장
- 웹 크롤링에 의한 텍스트 데이터 수집의 전반적인 과정
- 일반적인 웹 사이트 문서의 수집, 파싱, 저장 기법
- 웹 API의 이용
- 전용 클라이언트 라이브러리를 이용한 트위터 API 활용
3 텍스트 데이터의 전처리 2: 데이터 구조화와 언어 처리
- 텍스트 마이닝을 위한 효율적인 데이터 구조화
- KoNLPy 라이브러리를 이용한 형태소 분석
파이썬을 이용한 텍스트 데이터의 구조화
4 정보 추출과 탐색 1: 키워드 분석
- 텍스트 분석을 위한 문서 구조 단순화
- 열 지향 자료 형식의 활용
- wordcloud 라이브러리를 이용한 워드 클라우드 시각화
- squarify 라이브러리를 이용한 트리맵 시각화
- TFIDF의 의미와 계산 방법
5 정보 추출과 탐색 2: 연관어 분석
- n-gram
- 점 별 상호정보량
- Gensim 라이브러리를 이용한 바이그램 추출
- 어휘 공기 빈도의 계수화
- NetworkX 라이브러리의 기본적인 사용
6 문서 유사도의 측정과 문서-단어 행렬
- 문서 유사도의 측정 및 단어 벡터
- 자카드 유사도, 유클리드 거리, 코사인 유사도의 계산
- scipy 라이브러리를 이용한 벡터 거리
- 다차원배열(ndarray)의 생성
- scikit-learn 모듈을 이용한 문서-단어 행렬의 생성
주차 학습 목표 및 세부 내용
7 문서의 군집화
- 군집화의 기본 개념
- scipy 라이브러리를 이용한 계층적 문서 군집화
- scikit-learn 라이브러리를 이용한 비계층적 문서 군집화
- 군집화 결과의 시각화
8 텍스트 분류
- scikit-learn 라이브러리를 이용한 문서 분류
- 교차 검증
- 정확률과 재현률
- 그리드 검색을 이용한 분류기 최적화
9 단어 임베딩과 토픽 모델링
- 단어 임베딩과 토픽 모델링의 개념
- gensim 라이브러리를 이용한 단어/ 문서 임베딩
- gensim 라이브러리를 이용한 토픽 모델링
10 감성 분석
- 감성 분석의 개념과 방법
- 문서 분류 기법을 이용한 긍/부정 분석
- 감성어 사전 기반 세부 감성 분석

프로젝트 진행은 커리큘럼에 포함되어 있지 않습니다.

텍스트마이닝을 활용한 프로젝트는 강의 자체에서 필수적으로 진행하지는 않습니다. 다만, 수강 시 개별적으로 분석 프로젝트를 하시는 경우 마지막 강의에서 해당 프로젝트에 대한 경험을 공유하는 시간을 갖고 있습니다.

※ 본 코스에 들어 있는 ‘웹 크롤링’ 교육은 기본적인 원리와 절차를 소개하는 수준입니다.
※ 머신러닝과 관련된 라이브러리 활용법을 배웁니다. 머신러닝 이론·수학적 원리를 다루는 코스가 아닙니다.
※ 커리큘럼의 순서가 일부 변경될 수 있습니다.

자주 묻는 질문

Q . 분석을 위해 어떤 프로그래밍 언어를 사용하나요?

A . 본 CAMP는 파이썬을 활용해서 진행됩니다. 파이썬은 프로그래밍 언어 중에서도 상대적으로 익히기 쉬우면서도 강력한 프로그래밍 언어로, 자료 처리 분석을 위한 언어로 각광받고 있습니다. 파이썬에서의 텍스트 마이닝 분석 알고리즘을 익힘으로써 향후 데이터 사이언스의 다양한 분야들을 더욱 편리하게 습득하실 수 있습니다.

Q . 파이썬을 한 번도 써 본적이 없는데 수업을 따라갈 수 있나요?

A.  본 CAMP는 파이썬을 알려드리는 강의가 아닌, ‘텍스트 데이터 분석을 위한 도구’로서의 파이썬을 알려드리고 있습니다. 따라서 파이썬 코딩 경험이 전혀 없으시다면 강의 내용을 이해하시기 어려우실 수 있습니다. 따라서 아래 링크되어 있는 파이썬 코딩을 위한 기초 참고 자료의 사전 숙지를 권장 드리며, 수강 전 담당 매니저와 상담하시기 바랍니다.

{ FASTCAMPUS COMMUNITY MEMBERSHIP }

패스트캠퍼스 오프라인 강의를 수강하셨다면!
별도의 가입절차없이 패스트캠퍼스 커뮤니티 멤버쉽 회원이 됩니다.
커뮤니티 멤버쉽은 수강 후 1년 동안 유지되며,
오직 멤버들만을 위한 비공개 스터디클럽, 네트워킹행사, 세미나 등 비정기적 행사에 모실 예정입니다.

수강료

등록가

160만 원

개강 임박!  (5월 9일)

※ 수강생 모집이 마감되었습니다.
※ 수강 할인가는 매주 목요일 자정에 변경됩니다.
※ 신용카드 12개월 무이자 할부 가능

card_171120

학습 지원 프로젝트

공부도 하고! 학습지원금도 받고!

*학습지원금(제세공과금 22% 차감 후 지급)은 강의마다 개인마다 상이할 수 있습니다.

학습 목표 1. 과제 및 학습노트 제출

2회차~9회차 강의 내용에 대한 연습 문제 형식의 과제가 있습니다.
풀이는 다음 시간 진행 전 페이스북 그룹/메일을 통해 공유합니다.

코스 진행 일정 3일 후(일요일) 24:00까지 폼스택으로 과제 제출.
과제 접수 여부는 폼스택 접수시간으로 판단합니다.

[수강중 학습 콘텐츠 일정]: 학습노트 제출 2회/ 과제 제출 8회
1회차: 5월 12일(일)까지 학습노트 작성 후 제출
2회차: 5월 19일(일)까지 과제 제출
3회차: 5월 26일(일)까지 과제 제출
4회차: 6월 2일(일)까지 과제 제출
5회차: 6월 16일(일)까지 과제 제출
6회차: 6월 23일(일)까지 과제 제출
7회차: 6월 30일(일)까지 과제 제출
8회차: 7월 7일(일)까지 과제 제출
9회차: 7월 14일(일)까지 과제 제출
10회차: 7월 21일(일)까지 학습노트 작성 후 제출

학습지원금을 받으려면?

미션을 모두 완료하면 신청페이지를 통해 신청 가능합니다.
다만, 강의 종료 후 30일 이내에 신청페이지를 통해서 신청해주셔야 합니다.
아래의 환급신청 링크로 신분증 사본 / 환급받을 통장사본을 제출 (반드시 본인 명의로만 가능)해 주세요.
결제한 수강료의 10% (환급 금액의 22% 제세공과금으로 차감) 를 드리며, 학습지원금은 개인마다 상이할 수 있습니다.

환불규정

* 학습지원금은 기수강생 할인만 중복 적용이 가능합니다. (기타 다른 이벤트와 중복 적용이 불가합니다.)
* 과제물이 허위로 작성되거나 표절일 경우 환급이 거절될 수 있습니다.
* 환불은 환불규정(https://www.fastcampus.co.kr/refund/)에 따라 진행됩니다. 규정에 의거하여 환불금액이 없을 수 있습니다.