회사는 데이터 관리 및 분석을 위해 여러 유형의 데이터 스토리지 시스템을 사용합니다. 기업에서 데이터 마트를 사용하는 상황을 이해하기 위해 몇 가지 일반적인 유형의 데이터 스토리지를 살펴보겠습니다.
데이터베이스
데이터베이스는 컴퓨터 시스템이 정보를 저장, 검색 및 분석하는 데 사용하는 조직화된 스토리지입니다. 관계형 데이터베이스와 같은 다양한 유형의 데이터베이스가 있습니다. 관계형 데이터베이스는 행과 열로 구성된 테이블에 정보를 저장합니다. 서로 다른 테이블의 데이터는 키라고 하는 고유 식별자로 연결됩니다. 키는 특정 열의 반복되지 않는 값입니다.
데이터 마트와 데이터베이스 비교
데이터 마트는 부서 데이터의 전면 요소 역할을 합니다. 데이터 마트를 사용하여 정보를 검색하고 분석할 수 있습니다. 한편 데이터베이스는 정보를 수집, 관리 및 저장합니다. 그런 다음 도구를 사용하여 저장된 정보를 처리하고 형식을 지정하고 데이터 마트로 전송할 수 있습니다.
데이터 웨어하우스
데이터 웨어하우스 는 전체 비즈니스에 대한 정보를 저장하는 광범위한 데이터베이스 시스템입니다. 비즈니스 소프트웨어 및 소셜 미디어 피드와 같은 다양한 소스에서 원시 정보를 수집하고 테이블 형식으로 저장된 정형 데이터로 처리합니다. 기업은 엔터프라이즈 데이터 웨어하우스를 비즈니스 인텔리전스 도구에 연결하여 보다 현명한 결정을 내릴 수 있습니다.
데이터 마트와 데이터 웨어하우스 비교
데이터 마트는 데이터 웨어하우스의 많은 특성을 공유합니다. 차이점은 데이터 웨어하우스에는 다양한 주제에 대한 전사적 데이터가 포함되어 있다는 것입니다. 한편 데이터 마트는 특정 주제와 밀접하게 관련된 정보를 저장합니다. 예를 들어, 데이터 웨어하우스는 마케팅, 인사, 조달 및 고객 지원 부서에 대한 정보를 저장할 수 있습니다. 그러나 데이터 마트는 단일 부서와 관련된 트랜잭션 데이터만 저장할 수 있습니다. 데이터 마트 빌드의 매력은 데이터 마트를 관리하는 부서가 데이터 로드 및 관리를 완전히 제어할 수 있다는 것입니다.
많은 조직에서 데이터 공유와 같은 기술을 사용하여 데이터 마트를 중앙 데이터 웨어하우스에 게시하고 있습니다. 이를 통해 소유권을 분산시키고 워크로드를 격리하여 더 민첩해질 수 있습니다. 유사하게, 데이터 공유를 통해 부서별 데이터 마트는 데이터 웨어하우스 또는 기타 데이터 마트에서 공유된 데이터를 사용할 수 있습니다.
데이터 레이크
데이터 레이크 는 원시 및 비정형 정보를 보관하는 데이터 스토리지로서 파일과 폴더에는 정보를 저장하지 않습니다. 대신 처리되지 않은 정보를 대규모 스토리지의 플랫 계층 구조에 저장합니다. 데이터 레이크는 텍스트 문서, 이미지, 비디오, 오디오 등 다양한 유형의 원시 정보를 저장합니다.
데이터 분석가는 데이터 레이크를 사용하여 비정형 데이터에서 예측 분석을 수행합니다. 예를 들어, 데이터 레이크는 기업이 감정 분석에 사용할 수 있는 소셜 미디어 리뷰의 텍스트를 저장할 수 있습니다. 데이터 분석가는 감정 분석을 사용하여 회사에 대한 부정적인 의견 추세를 감지할 수 있습니다.
데이터 마트와 데이터 레이크 비교
데이터 레이크는 처리되지 않은 데이터를 저장하기 때문에 일부 정보는 중복되거나 회사에 의미가 없을 수 있습니다. 한편, 데이터 마트는 특정 요구에 맞는 처리된 데이터를 저장합니다. 데이터 레이크는 데이터 마트의 소스가 될 수 있습니다. 기업은 데이터 마트의 기록 데이터를 보고 데이터 추세를 결정하지만 데이터 레이크를 사용하여 저장된 정보를 심층적으로 분석합니다.
OLAP
온라인 분석 처리(OLAP)는 데이터를 여러 차원으로 표현하는 방법입니다. 예를 들어, 데이터 분석가는 OLAP 큐브를 사용하여 월, 도시 및 제품을 기준으로 판매 수익을 동시에 표시합니다. OLAP 데이터 구조는 광범위하며 필드가 팩트 또는 차원으로 분류되어 데이터 중복이 발생합니다. 이는 좁은 구조와 적은 데이터 중복을 선호하는 기존의 관계형 데이터베이스와 대조됩니다.
데이터 마트와 OLAP 큐브 비교
OLAP은 데이터를 넓은 테이블로 비정규화하는 특정 정보 저장 전략입니다. OLAP은 다차원 데이터의 복잡한 표현을 단순화합니다. 일부 데이터 마트는 OLAP을 사용하여 정보를 구조화할 수 있지만 다른 데이터 마트는 기존의 정규화된 구조를 사용합니다. 비즈니스 분석가는 OLAP 구조를 활용하여 데이터 마트의 정보를 시각화합니다.
운영 데이터 스토어
운영 데이터 스토어(ODS)는 데이터 소스와 데이터 웨어하우스 간의 중개자 역할을 하는 정보 스토리지입니다. 데이터 분석가는 ODS를 사용하여 트랜잭션 데이터에 대한 실시간에 가까운 보고를 제공합니다. ODS는 간단한 쿼리를 지원하며 제한된 양의 정보만 제공합니다. 예를 들어, ODS는 지난 12시간 동안의 판매 레코드만 저장할 수 있습니다.
데이터 마트와 ODS 비교
데이터 마트는 데이터 웨어하우스에서 주제 지향 정보를 추출하지만 ODS는 처리를 위해 정보를 데이터 웨어하우스로 전송합니다. 데이터 마트는 분석할 수 있는 기록 정보를 제공하지만 ODS는 현재 작업에 대한 업데이트된 보기를 제공합니다. 예를 들어, 데이터 마트를 사용하여 지난 분기의 판매 패턴을 식별하고 ODS에서 시간별 판매 수치 업데이트를 수신할 수 있습니다.