비디오 데이터는 현실에서 5D 텐서가 필요한 몇 안 되는 데이터 중 하나입니다. 하나의 비디오는 프레임의 연속이고 각 프레임은 하나의 컬러 임지입니다. 프레임이 (height, width, color_depth)의 3D 텐서로 지정될 수 있기 때문에 프레임의 연속은 ( frames, height, width, color_depth)의 4D 텐서로 저장될 수 있습니다. 여러 비디오의 배치는 (sample, frames, height, width, color_depth)의 5D텐서로 저장될 수 있습니다.
예를 들어 60초 짜리 144 * 256 유튜브 비디오 클립을 초당 4프레임으로 샘플링하면 240 프레임이 됩니다. 이런 비디오 클립을 4개 가진 배치는 (4, 240, 144, 256, 3) 크기의 텐서에 저장될 것입니다. 총 106, 168, 168, 329개으 ㅣ값이 있습니다! 이 텐서의 dtype을 float32로 했다면 각 값이 32 비트로 저장될 것이므로 텐서의 저장 크기는 405MB가 됩니다. 아주 크네요! 실생활에서 접하는 비디오는 float32 크기로 저장되지 않기 때문에 용량이 적고, 일반적으로 높은 압축률로(MPEG 포맷 같은 방식을 사용하여)압축되어 있습니다.
댓글 없음:
댓글 쓰기