기 간 2019. 01. 17 ~ 03. 28 (총 10회, 2월 7일 휴강)
일 정 목요일 PM 7:30 ~ 10:30 (주 1회, 회 당 3시간)
장 소 패스트캠퍼스 강남 강의장
담당자 윤형진 매니저 02-517-0641
help-ds@fastcampus.co.kr

텍스트마이닝을
체계적으로 배울 수 있는 곳을 찾는 당신에게

국내 최고의 강의를 소개합니다.

어려운 텍스트 분석, 어떻게 배워야 할까?

텍스트 데이터, 왜 분석이 어려운가?

텍스트는 수치 데이터에 비해 분석이 어렵습니다. 그 이유는 인간의 언어가 프로그램 코드처럼 분명하고 정교한 문법으로 표현되지 않기 때문이죠. 특히, 한국어는 그 구조의 복잡도가 높아 분석하기 까다롭습니다. 때문에, 언어학적인 이해와 분석 알고리즘에 대한 지식을 모두 갖추어야 제대로된 분석이 가능합니다. 하지만, 이 모든 것을 다루는 강의는 없었습니다.

[언어학 + 알고리즘] 모두 다루는 국내유일의 커리큘럼

본 CAMP는 언어학자이자, 국내 최고의 텍스트 분석 전문가인 강사님의 직강으로 진행됩니다. 단순히 코딩을 따라치고 결과만 확인하는 강의가 아닙니다. 총 10주간 한국어의 언어적 특성부터 다양한 분석 알고리즘, 그리고 이를 구현하기위한 파이썬 코드까지 체계적으로 가르쳐드리는 강의입니다. 그 어디에서도 볼 수 없던 최고의 커리큘럼을 경험하세요!

텍스트 분석의 정수를 배우세요!

한글의 언어적 특성

텍스트 분석 알고리즘

텍스트 분석에 필요한 파이썬 코딩

한글 텍스트 분석을 위한 3step 강의

텍스트 분석의 활용 범위는 무궁무진합니다. 하지만, 진짜 유의미한 결과를 도출하고, 새로운 인사이트를 찾기 위해서는 텍스트마이닝 분야에 대한 깊이있는 이해가 필요합니다. 이를 위해 본 캠프에서는 분석에 앞서 알아야할 한국어의 언어적 특성에 대해 차근차근 가르쳐드립니다. 이를 기반으로 분류, 군집, 감성 분석 등 다양한 알고리즘을 다루어, 실제 텍스트가 목적에 따라 어떻게 분석될 수 있는지 학습합니다. 이에 필요한 파이썬 코드도 다루기 때문에 실제 구현 역량까지 기르실 수 있습니다. 

1:1 밀착 지도를 위한 조교 시스템

강의 내용을 빠짐없이 소화하실 수 있도록 조교님이 강의에 참여합니다. 특히, 파이썬 코딩 파트에서 도움이 필요하시다면, 언제든 손을 들고 조교님을 부르세요. 수강생 한분 한분 모르는 부분을 해결하실 때 까지 조교님이 친절히 가르쳐드립니다.

텍스트마이닝 실무 사례 특강

강의 중반인 6회차에 현재 텍스트 데이터 엔지니어로 일하고 있는 실무자의 텍스트 분석 활용 사례 특강을 마련하였습니다. 현업에서 텍스트 마이닝이 어떻게 활용되는지 살펴보는 시간인 동시에 평소 궁금했던 점을 마음껏 질문하실 수 있는 기회가 될 것 입니다.

당신에게 추천합니다

연구나 논문 작성에 텍스트 데이터 분석을
적용하고 싶은 연구자

한글 데이터에 텍스트 마이닝을 적용하기 위해서는 프로그래밍 기법 뿐만 아니라 형태소 분석 등 자연어 처리 이론을 전반적으로 이해 해야 합니다. 텍스트 마이닝을 통해 구현 가능한 DB 상에서의 문서 분류, 신문/ 논문/ 보고서 요약, 키워드/ 토픽 추출, 대규모 문서에서의 등을 통해 연구의 질을 향상시킬 수 있습니다. 

텍스트 데이터가 많은 기업에서
텍스트 마이닝을 적용하고 싶은 분석가 

지금까지 분석되지 않은 채로 쌓여있는 방대한 양의 텍스트 데이터를 한데 모아 하나의 시각화 된 인사이트로 분석 결과를 얻고 싶은 분. 언론사, 블로그 포스팅을 기반으로 한 홍보 채널, 후기 콘텐츠 분석이 중요한 상품의 매출과 영업이익에서는 드러나지 않았던 새로운 인사이트를 발굴할 수 있습니다.

본 캠프는 파이썬을 사용하여 텍스트 데이터 분석을 진행하고 있습니다. 아래 질문에 답하고 캠프를 수강해도 괜찮을지 체크해보세요!

파이썬을 실행해 본 적이 있다.

파이썬에서 list, tuple, dictionary가 무슨 의미인지 알고 있다.

조건문(if)이나 반복문(for, while)이 어떻게 구성되는 개념인지 알고 있다.

파이썬에서 def가 무엇을 위한 명령어인지 알고 있다.

파이썬 스크립트를 읽어 보면 무슨 의미인지 어느 정도 해석할 수 있다.

위 질문에 3개 이상 YES라고 답하셨다면
본 캠프를 수강하셔도 좋습니다.

위 질문에 3개 이상 NO라고 답하셨다면
자세한 상담을 위해 “반드시” 코스매니저에게 연락해주세요!

텍스트 마이닝 전문 강사님을 소개합니다

data_camp_tm_speaker

다음소프트 이사/ 텍스트 처리 전문가 이기황 박사님


텍스트 마이닝 분야의 전문가이신 이기황 박사님은 다음소프트에서 소셜 빅데이터 분석 관련 연구와 개발을 수행하고 있습니다. 영국 에든버러 대학교 전산언어학 및 언어공학 박사이시며, 연세대학교 언어정보연구원 HK 연구 교수로 지내셨습니다. 여러 대학교에서 전산언어학, 텍스트 마이닝, 그리고 디지털 인문학관련 과목 강의를 진행하셨습니다. 대규모 텍스트 및 언어 자료에 기반한 다수의 연구에 참여한 경험이 있습니다.

FMST

실습 조교/다음소프트 텍스트 데이터 엔지니어 김주영님


현재 다음소프트에서 텍스트 데이터를 분석하고 전달하는 일을 하고 있습니다. 매 수업시간마다 진행되는 실습 과정에서 수업을 따라가실 수 있도록 1:1로 옆에서 친절하게 도와드립니다. 수업을 못따라가는 수강생들을 중간중간 모아서 계속 도움을 주시면서 강의를 서포트해드립니다.

체계적인 10주 커리큘럼

주차 학습 목표 및 세부 내용
파이썬을 이용한 텍스트 처리 기초
1 텍스트 마이닝의 소개 및 파이썬 작업 환경 구축
- 텍스트 마이닝의 개념과 응용 사례
- 파이썬 언어 소개
- 아나콘다 파이썬의 설치
- Jupyter Notebook을 이용한 파이썬 입문
2 파이썬 텍스트 처리 기법(1)
- 숫자와 문자, 그리고 문자열
- 리스트, 딕셔너리, 세트
- 파이썬의 단문과 복문
- 내장 함수와 표준 라이브러리
3 파이썬 텍스트 처리 기법(2)
- 텍스트의 수집, 정제, 저장
- 웹 크롤링의 원리와 절차 이해
- 실전 웹 크롤링
파이썬을 이용한 텍스트 데이터의 구조화
4 형태소 분석과 후처리
- 형태소와 형태소 분석의 개념
- 형태소 분석 라이브러리의 설치와 사용
- 형태소 분석 결과의 구조화와 저장
- 형태소 분석 결과의 후처리
5 문서 군집
- 문서 군집의 개념
- 문서의 속성과 유사도 측정
- 계층적 군집 분석
- 비계층적 군집 분석
6 문서 분류
- 문서 분류의 개념
- 나이브 베이즈 모델을 이용한 문서 분류
- 문서 분류의 성능 평가
- 그리드 탐색에 의한 문서 분류 파라미터 최적화
주차 학습 목표 및 세부 내용
파이썬을 이용한 텍스트 마이닝 응용
7 키워드 분석
- 형태소 빈도 계수
- 형태소 빈도의 시각화
- 용어 빈도와 문헌 빈도
- 분류 사전의 활용
8 어휘 공기 분석
- 어휘 공기의 개념
- 어휘 공기의 추출과 계수
- 어휘 공기 행렬의 구성
- 어휘 공기 네트워크의 생성
9 토픽 모델링과 워드 임베딩
- 토픽 모델링의 개념
- 토픽 모델링을 이용한 주제 분석
- 워드 임베딩의 개념
- 워드 임베딩을 이용한 유사도 분석
10 감성 분석
- 감성 분석의 개념과 방법
- 문서 분류 기법을 이용한 긍/부정 분석
- 감성어 사전 기반 세부 감성 분석
- 개인별 텍스트 마이닝 프로젝트 경험 나누기

프로젝트 진행은 커리큘럼에 포함되어 있지 않습니다.

텍스트마이닝을 활용한 프로젝트는 강의 자체에서 필수적으로 진행하지는 않습니다. 다만, 수강 시 개별적으로 분석 프로젝트를 하시는 경우 마지막 강의에서 해당 프로젝트에 대한 경험을 공유하는 시간을 가지고 있습니다.

※ 커리큘럼의 순서가 일부 변경될 수 있습니다.

자주 묻는 질문

Q . 분석을 위해 어떤 프로그래밍 언어를 사용하나요?

A . 본 CAMP는 파이썬을 활용해서 진행됩니다. 파이썬은 프로그래밍 언어 중에서도 상대적으로 익히기 쉬우면서도 강력한 프로그래밍 언어로, 자료 처리 분석을 위한 언어로 각광받고 있습니다. 파이썬에서의 텍스트 마이닝 분석 알고리즘을 익힘으로써 향후 데이터 사이언스의 다양한 분야들을 더욱 편리하게 습득하실 수 있습니다.

Q . 파이썬을 한 번도 써 본적이 없는데 수업을 따라갈 수 있나요?

A.  본 CAMP는 파이썬을 알려드리는 강의가 아닌, ‘텍스트 데이터 분석을 위한 도구’로서의 파이썬을 알려드리고 있습니다. 따라서 파이썬 코딩 경험이 전혀 없으시다면 강의 내용을 이해하시기 어려우실 수 있습니다. 따라서 아래 링크되어 있는 파이썬 코딩을 위한 기초 참고 자료의 사전 숙지를 권장 드리며, 수강 전 담당 매니저와 상담하시기 바랍니다.

수강료

등록가

일반등록가 160만 원

다음 일정이 궁금하시면, [출시알림]을 신청해 주세요.

※ 수강 할인가는 매주 목요일 자정에 변경됩니다.
※ 카드 12개월 무이자 할부 가능