페이지

2022년 7월 23일 토요일

3.1.2 모델: 층의 네크워크

 딥러닝 모델은 층으로 만든 비순환 유형 그래프(Directed Acyclic Graph, DAG)입니다. 가장 일반적인 예가 하나의 입력을 하나의 출력으로 매핑하는 층을 순서대로 쌓는 것입니다.

앞으로 공부하다 보면 아주 다양한 네트워크 구조를 보게 될 것입니다. 자주 등장하는 것들은 다음과 같습니다.

1) 가지(branch)가 2개인 네트워크

2) 출력이 여러 개인 네트워크

3) 인셉션(Inception) 블럭

네트워크 구조는 가설공간(hypothesis space)을 정의합니다. 1장에서머신 러닝을 '가능성 있는 관을 사전에 저의하고 피드백 신호의 도움을 받아 입ㅂ력 데이터에 대한 유용한 변환을 찾는 것'으로 정의했는데 기억날지 모르겠습니다. 네트워크 구조를 선택함으로써 가능성 있는 공간(가설 공간)을 입력 데이터에서 출력 데이터로 매핑하는 일련의 특정 텐서 연산으로 제한하게 됩니다. 우리가 찾아야 할 것은 이런 텐서 연산에 프홈된 가중치 텐서의 좋은 값입니다.

딱 맞는 네트워크 구조를 찾아내는 것은 과학보다는 예술에 가깝습니다. 신뢰할 만한 모범적인 사례와 원칙이 있지만 연습을 해야만 적절한 신경망을 설계할 수 있는 기술을 갖추게 될 것입니다.

다음 몇 개의 장에서 신경망을 만드는 원리를 배우고 특정 문제에 적용 가능한 것과 그렇지 않은 것에 대한 직관을 길러 봅시다.

댓글 없음: