[Deep Learning] CNN, RNN 간단히 알아보기

January 21, 2022 1 minute read

개념을 간단하게 설명해주는 강의여서 어렵지 않았다.

CNN

Convolution 연산의 수학적인 의미는 신호(signal)를 커널을 이용해 국소 적으로 증폭 또는 감소시켜서 정보를 추출 또는 필터링하는 것입니다.
수식으로 이해하기 어려우니 그림으로 이해하자.

cnn1

cnn2

소리, 문자열, 주가 등의 데이터를 시퀀스(sequence) 데이터로 분류
시퀀스 데이터는 독립동등분포(i.i.d.) 가정을 잘 위배하기 때문에 순서를 바 꾸거나 과거 정보에 손실이 발생하면 데이터의 확률분포도 바뀌게 된다.
베이즈 법칙을 이용하여 이전 시퀀스 정보를 이후 발생할 데이터의 확률분포를 다루기 위해 조건부확률을 이용한다.

rnn1

rnn2 위의 그림에서 빨간색 부분을 \(\tau\)(타우)로 나타내고 타우만큼의 시퀀스만 사용하는 경우 AR(\(\tau\)) (Autogressive Model) 자기회귀모델이라고 부른다.

rnn3 다른 방법으로는 위의 그림을 보면 바로 이전 정보를 제외한 나머지 정보들을 \(H_t\)라는 잠재변수로 인코딩해 활용하는 잠재 AR모델이다. \(H_t\)를 신경망을 통해 반복해서 사용하여 시퀀스 데이터의 패턴을 학습하는 모델이 RNN이다.

rnn4

rnn5

기울기 소실