머신러닝을 위한
선형대수학
CLASS.

Laptop Img 머신러닝에 필요한 선형대수 핵심 강의 Setting Img 입문자 눈높이의 쉬운 설명 Mic Img 실습을 통한 완벽 이해
  • 기간

    2018년 10월 29일
    - 2018년 11월 19일
    총 4주

  • 일정

    매주 월요일
    19:30 -22:30
    매주 1회, 회당 3시간
    총 4회, 총 12시간

  • 장소

    패스트캠퍼스 강남강의장

  • 문의

    강호준 매니저
    02-517-0697
    help-ds
    @fastcampus.co.kr

강의 목표.

머신러닝을 위해 알아야할 필수 선형대수학을 익혀 보다 정확도 높은 결과값을 도출하기 위한 데이터의 특성 추출이나 예측 방법을 익히는 것.

강의 개요.

머신러닝은 말그대로 컴퓨터(machine)에게 공부(learning)를 시켜서 내가 원하는 분석이나 예측을 하게 하는 기술입니다. 이때, 컴퓨터가 공부를 잘할 수 있도록 돕기 위해서는 다양한 도구를 사용할 필요가 있는데, 그 중 하나가 바로 선형대수라고 할 수 있죠. 때문에 선형대수를 모르면 머신러닝을 완전히 정복할 수 없습니다.

하지만, 선형대수는 그 분야 자체가 워낙 방대하여서, 중요성을 알고있다고 해도 스스로 공부하기가 쉽지 않습니다. 그래서 만들어진 본 강의는 수많은 개념과 이론들 중에서 ‘머신러닝’을 자유자재로 만지기위해 꼭 알아야할 선형대수 개념들만 압축적으로 가르쳐드리기 떄문에, 4주간 머신러닝 분야에서 한단계 나아가기 위한 초석을 단단히 다지실 수 있습니다.

강의 예시.

예시 (1) 가장 기본적인 머신러닝 알고리즘인 선형회귀를 이해하려면?

Transpose와 같은 기본적인 행렬 연산부터 열공간(Column space)에 대한 개념과 선형방정식(Least Square Problem)에 대한 이해를 필요로 합니다.

예시 (2) 개와 고양이를 구분하는 분류 문제를 풀기 위해서는?

내적과 같은 행렬연산부터 이미지들 사이의 유사도를 구하기 위한 Norm, 복잡한 행렬 연산에 사용되는 LU Decomposition 등 다양한 개념을 이해하고 있어야 합니다.

강사 소개.

ljh-200x200

강사 이주희

이화여자대학교에서 수학으로 박사학위를 취득하였습니다. 주 연구분야는 암호학입니다. IoT, 블록체인, 머신러닝 등과 같은 다양한 응용분야에서의 효율적인 암호 원천 기술 개발과 그 기반이 되는 수학적 이론을 연구하고 있습니다. 2017년 6월부터 딥러닝에 관심갖게 되었고, 머신러닝/딥러닝에서 필요한 수학을 정리하고 있습니다. 최근엔 인공지능과 수학 워크샵에 조인하여 활동하고 있고, Deep Learning College에서 선형대수/미적분학/최적화문제/확률및통계 강의를 하고 있습니다. 새로운 것을 배우는 가장 빠른 길은 직접 강의를 하는 것이라는 철학으로 이 강의를 시작하게 되었습니다.

[ 약력 ]

– 現 ARIST 선임연구원
– 이화여자대학교 수리과학연구소 연구교수
– Deep Learning College 수학 강의
– 인공지능과 수학 워크샵 조직위원

강사 인터뷰.

머신러닝, 딥러닝 공부를 하는데 있어서 '선형대수'가 왜 필요한가요?

“머신러닝, 딥러닝 공부를 하는데 있어서 선형대수가 왜 필요한가?”에 대한 얘기를 하려면, ‘대수학’ (https://ko.wikipedia.org/wiki/대수학)이라는 단어를 떠올려보시면 좋을것 같습니다. 대수학이란 “공리”라 불리우는 가정들을 만족하는 수학적 물체들의 “일반적인 성질”을 연구하는 수학의 한 분야입니다. 머신러닝, 딥러닝을 공부한다는 것은 다양한 데이터들의 공통된 특징을 추출한다거나, 기존의 데이터에 기반하여 다음 데이터에 대한 예측값등을 연구하는 것인데, 이런 것들을 성질이라고 할 수 있습니다. 다양한 데이터들의 나열을 벡터로 표현 가능하고, 이들의 일반적인 성질을 연구하는 것이 머신러닝/딥러닝을 공부하는 목표라면, 그 시작은 선형대수로부터 라고 해도 과언은 아닐듯 합니다.

커리큘럼.

PART 1. FEED FORWARD NETWORK

요약 : Feed Forward Network의 은닉층의 노드들을 데이터가 지나갈 때 거치게 되는 벡터의 내적(Inner Product)과 행렬의 곱(Multiplication)과 같은 연산들에 대해 배워봅니다.

Feed Forward Network(순전파 신경망, FFN)란 가장 간단한 형태의 신경망으로서 회귀(Regression)나 분류(Classification) 문제에 모두 사용할 수 있습니다. Feed Forward Network에서는 데이터가 은닉층(Hidden Layer)이라고도 불리는 모든 노드들을 한번씩 거쳐서 출력이 됩니다. 이런 은닉층의 노드들을 지나갈 때 데이터에 대한 여러가지 연산과정이 이루어지는데, 바로 이 연산에 사용되는 벡터의 내적(Inner Product)과 행렬의 곱(Multiplication)에 대해 배워봅니다.

1) Feed Forward Network(순전파 신경망, FFN)은 무엇인가 ?
2) FFN을 이해하기 위한 선형대수 기초 개념 : 벡터와 행렬
3) FFN 연산에 사용되는 주요 선형대수 개념 : 벡터의 내적
4) FFN 이해에 필요한 선형대수 기타 개념
– 벡터연산(addition, scalar multiplication, Transpose)
– 행렬연산(addition, scalar multiplication, Transpose)

실습
1) 파이썬 코드 작성 및 각 코드의 의미와 실행결과 살펴보기
– 벡터의 내적
– 벡터 및 행렬연산

Part 2. Linear Regression

요약 : 머신러닝의 기본이 되는 회귀(Regression)을 이해하기 위한 선형방정식(Least Square Problem)과 같은 다양한 개념들에 대해 알아봅니다.

머신러닝에서 다루는 가장 일반적인 문제 중 하나는 회귀(Regression) 문제로서 회귀는 머신러닝을 이해하기 위한 근간이 됩니다. Linear Regression(선형회귀)란 여러가지 회귀 알고리즘 중 가장 기본적인 알고리즘으로서 종속변수와 독립변수 간의 선형 상관관계를 모델링하는 기법입니다. 이러한 Linear Regression을 이해하기 위해서 선형에 대한 개념부터 vector space, row space, column space, inverse matrix, orthogonal projection, 벡터의 내적 등 다양한 개념에 대해 알아봅니다.

1) 선형방정식(Least Square Problem)이란 무엇인가 ?
2) Linear Regression에 사용되는 주요 선형대수 개념
– 선형방정식의 해
– 선형방정식의 해와 열공간의 관계
– orthogonal projection
3) 선형방정식에 필요한 선형대수 기타 개념
– 행렬연산(Identity matrix, inverse matrix )
– 행렬연산(addition, scalar multiplication, Transpose)
– 선형방정식의해구하기

실습
1) 파이썬 코드 작성 및 각 코드의 의미와 실행결과 살펴보기
– 선형방정식의 해
– vector space, row space, column space
– orthogonal projection
– 행렬연산(Identity matrix, inverse matrix)
– 행렬연산(addition, scalar multiplication, Transpose)

Part 3. KNN과 PCA

요약 : 분류(Classification) 문제를 풀기 위한 kNN(k-Nearest Neighbor)과 PCA를 이해하는데 필요한 고유값과 고유벡터 norm 등의 개념에 대해 배워봅니다.

회귀 문제 외의 또다른 주요 머신러닝 문제로는 분류(Classification) 문제가 있습니다. kNN(k-Nearest Neighbor)은 이러한 분류 문제를 풀기 위한 대표적인 알고리즘 중 하나로서 분류하고자 하는 데이터가 얼마나 가까이 있는지를 통해 분류를 합니다. PCA(Principal Component Analysis)는 kNN을 사용하는 과정에서 데이터의 특징을 추려내는데 사용되는 알고리즘이며, 고차원의 데이터를 저차원으로 환원하는 차원축소(Dimension Reduction)를 수행하는 역할을 합니다. kNN과 PCA를 이해하기 위해 norm, 고유값, 고유벡터, SVD 등의 개념을 살펴봅니다.

1) kNN(k-Nearest Neighbor)과 PCA(Principal Component Analysis)는 무엇인가 ?
2) kNN과 PCA에 사용되는 주요 선형대수 개념
– 다양한 Norm의 정의
– 고유값과 고유벡터
– SVD(Singular Value Decomposition) 구하기
– SVD의 기하학적 의미
3) kNN과 PCA에 필요한 선형대수 기타 개념
– 선형변환
– 공분산행렬(평균, 분산)

실습
1) 파이썬 코드 작성 및 각 코드의 의미와 실행결과 살펴보기
– SVD(Singular Value Decomposition) 구하기
– 선형변환
– 공분산행렬(평균, 분산)

Part 4. SVM

요약 : 주요 분류 알고리즘인 SVM(Support Vector Machine)에서 벡터의 내적과 norm 그리고 초평면 등이 어떻게 사용되는지 알아봅니다.

분류 알고리즘에서 빼놓을 수 없는 것 중 하나가 바로 SVM(Support Vector Machine)입니다. SVM은 두 가지 클래스를 분류하기 위한 직선을 찾는 알고리즘이며, 이를 이해하기 위해서 앞서 배운 벡터의 내적과 norm 그리고 초평면 등에 대한 개념을 공부해봅니다.

1) SVM(Support Vector Machine)이란 무엇인가 ?
2) SVM에 사용되는 주요 선형대수 개념
– SVM에서 벡터는 어떻게 사용되는가 ?
– 벡터의 내적 : w•x+b=0 에서w(웨이트벡터), •, x, b는 무엇이고 •(벡터의 내적)은 왜 필요한가 ?
– 초평면은 무엇이고 SVM에서 왜 필요하며 어떻게 사용되는가 ?
3) SVM에 필요한 선형대수 기타 개념
– Linear programing
– Optimization
– 미분
– 라그랑주승수법
– kernel function

실습
1) 파이썬 코드 작성 및 각 코드의 의미와 실행결과 살펴보기
– 벡터의 내적과 초평면의 개념을 활용한 SVM

추천 대상.

– 방대한 양의 선형대수 지식 중 머신러닝/딥러닝에 필요한 부분만 체계적으로 공부하고 싶으신 분
– 만들어진 알고리즘을 갖다쓰는 수준을 넘어서서 새로운 알고리즘을 만들거나 알고리즘을 좀더 깊게 활용하고 싶은 분

사전
체크리스트.

고등학교 졸업 후 개인적으로 수학공부(선형대수)를 해본 경험이 없다면 수강이 어렵습니다.
아래 질문 중 1-2에 해당하시는 분들께 수강을 추천드리며, 3번에 해당 하시는 분은 02-517-0697로 전화문의부탁드리겠습니다.

1) 칸아카데미 선형대수의 난이도가 어렵다.
2) 칸아카데미 선형대수의 난이도는 소화할 만 하다
3) 칸아카데미 선형대수의 난이도는 조금 쉽다.

자주묻는
질      문.

이 강의를 듣고난 후에 들어면 좋을 강의가 있을까요?

네, 있습니다. 머신러닝 기초 과정 수강을 추천드립니다.

 1. 파이썬을 활용한 머신러닝 CAMP
파이썬으로 다양한 실습예제를 풀어보며, 머신러닝의 알고리즘을 200% 이해할 수 있습니다.

강의 정보 확인하기 (click) >>

 

2.R을 활용한 머신러닝 CAMP
입문자에게 맞게 국내 기업의 머신러닝 적용 프로젝트 경험이 많은 강사님이 머신러닝 알고리즘을 해석해드립니다.
강의 정보 확인하기 (click) >>

수강료
안  내.

일반 등록가 : 60만 원

※ 할인가는 매주 목요일 자정에 변경됩니다.
※ 카드 12개월 무이자 할부 가능!

강의 장소.