페이지

2024년 10월 3일 목요일

1. 소스와 마트

먼저 소스는 원장성 데이터를 말한다. 흔히 말하는 기간계 데이터를 직접 바라보고, 만든 2차 데이터다. 그리고 마트성 데이터는 이 2차 데이터를 어떤 목적을 가지고 집계하고 가공한 데이터를 말한다.

예를 들면, 월 단위로 집계되는 고객 거래 정보 데이터는 소스로 볼 수 있다. 그리고 상품추천을 위해 고객 거래 정보 등을 이용한 추천 마트는 마트성 데이터에 해당한다. 즉, 원천성 데이터는 범용성을 목적으로 구성되면, 마트성 데이터는 특수 목적을 위해 만들어진다는 차이가 있다.

하지만, 간혹 마트성 데이터에 집계된 결과가 신규 과제에서 필요한 변수와 유사한 경우가 있다. 이 경우 마트성 데이터를 잘 활용하면 좋을 수도 있다. 변수에 대한 업무정의나 검증을 하지 않아도 되기 때문이다. 그리고, 굳이 변수를 만들지 않아도 된다는 장점도 있다.

[더 알아보기] 기간계와 정보계

보통 기간계와 정보계로 나누어 데이터를 관리한다. 기간계는 운영에 사용되는 데이터를 말한다. 예를 들면, 실시간으로 쌓이는 계약이나 거래 정보를 기록하는 데이터다. 기간계 데이터베이스에 문제가 생기면, 기업 운영에 치명적인 피해가 발생한다. 반면, 정보계는 마케팅, CRM 등과 같은 업무를 목적으로 관리하는 데이터베이스다. 보통 일이나 월 단위로 기간계 데이터를 집계해 정보계에 쌓는다. 이때, 기간계에서 정보계로 직접 쌓는 데이터를 '소스'라고 정의했다.

댓글 없음: