일반적으로 딥러닝에서 사용하는 모든 데이터 텐서의 첫 번째 축(인텍스가 0부터 시작하므로 0번째 축)은 샘플 축(sample axis)입니다(이따금 샘플 차원(sample dimension)이라고 부릅니다. MNIST예제에서는 숫자 이미지가 샘플입니다.
딥러닝 모델은 한 번에 전체 데이터셋을 처리하지 않습니다. 그 대신 데이터를 작은 배치(batch)로 나눕니다. 구체적으로 말하면 MNIST 숫자 데이터에서 크기가 128인 배치 하나는 다음과 같습니다.
batch = train_images[:128]
그다음 배치는 다음과 같습니다.
batch = train_images[128:256]
그리고 n번째 배치는 다음과 같습니다.
batch = train_images[128 * n:128 * ( n+ 1)]
이런 배치 데이터를 다룰 때는 첫 번째 축(0번 축)을 배치 축(batch axis) 또는 배치 차원(batch dimension)이라고 부릅니다. 케라스나 다른 딥러닝 라이브러리를 사용할 때 이런 용어를 자주 만날 것입니다.
댓글 없음:
댓글 쓰기