728x90
728x90
지난 시간에 AI의 단군할아버지인 퍼셉트론에 대하여 알아봤습니다. 퍼셉트론의 가장 큰 문제는 비 선형적인 문제를 해결하지 못한다는 점이 있었죠! 기억하시나요?(XOR 문제를 해결하지 못하는 한계). 오늘은 그 한계를 뛰어넘을 수 있는 방법인 다층 퍼셉트론(MLP, Multi-Layer Perceptron)에 대해 이야기해볼게요!
다층 퍼셉트론이란?
MLP는 말 그대로 퍼셉트론을 여러개 쌓아서 만드는 모델 구조입니다.
입력층(Input Layer), 은닉층(Hidden Layer), 출력층(Output Layer)으로 구성되며 특히 이전 퍼셉트론과 다른 점은 은닉층이 추가된다는 점에 있어요!
MLP의 구조
MLP는 아래와 같은 구조를 가집니다.

- 입력층(Input Layer): 입력 데이터를 넣는 곳
- 은닉층(Hidden Layer): 데이터를 가공하고 패턴을 학습하는 곳
- 출력층(Output Layer): 예측 결과 데이터를 출력하는 곳
MLP의 핵심 개념
- 활성화 함수(Activation Function): 퍼셉트론의 한계를 극복하기 위해, MLP에서는 ReLU, Sigmoid, Tanh 같은 활성화 함수를 사용해요. 이를 통해 모델이 더 복잡한 패턴을 학습할 수 있어요. 활성화 함수가 없다면, 퍼셉트론을 여러겹 쌓는것은 아무 의미가 없답니다.(이 이야기는 다음시간에 알아보도록 하죠!)
- 역전파 알고리즘(Backpropagation): 가중치를 업데이트하는 방법으로 MLP에서는 미분을 사용해야합니다. 그 미분을 가능하게 하는 방법이 바로 역전파 알고리즘입니다.(이 이야기도 다다음 시간에 알아보도록 해요)
이번 시간에는
MLP는 퍼셉트론의 한계를 극복하고 신경망의 가능성을 열어준 중요한 개념이에요. 하지만 현대 딥러닝에서는 CNN, RNN, Transformer 같은 더 발전된 모델들이 등장했죠. 다음시간에는 이러한 최신 개념을 익히기 이전에 MLP의 중요 핵심 개념인 활성화함수와 역전파 알고리즘에 대하여 자세히 다루어보는 시간을 가져보도록 하겠습니다! 감사합니다.
728x90
728x90
'Artificial intelligence > DeepDiveToAI' 카테고리의 다른 글
001. 퍼셉트론, 인공지능의 첫걸음 (1) | 2025.03.25 |
---|---|
000. Hello, Deep Dive Into AI! (1) | 2025.03.01 |