이건 어디까지나 내 생각이다. 이론이 아닌 경험에서 배운 것이라 허술할 수 있다. 만약 내가 한 기업의 데이터 분석 사업을 담당한다면, 체계를 이렇게 가져가고 싶다.
먼저, 기간계 데이터를 이용해 만드는 소스 데이터를 정의한다. 필요에 따라 추가할 수 있다. 이 데이터의 목적은 범용성이다. 원본 정보를 최대한 있는 그대로 녹이는 게 목적이다. 당연히 사이즈가 클 것이다(파이션이나 인덱스 등을 잘 관리하는 게 중요할 듯).
소스가 정의되었다면, 리포트나 캠페인 등을 목적으로하는 마트 데이터 영역을 따로 정의한다. 마트는 마트를 바라보지 않는다. 이게 기본 원칙이다. 만약, 다양한 시스템을 구축하며, 공통으로 필요하다고 생각되는 데이터가 있다면, 이런 데이터는 소스에 추가한다. 프로젝트 효율을 높이기 위해서다. 소스로 관리되는 월배치 데이터는 월초(1~5일) 사이에 배치를 끝낸다. 그래야 업무 목적의 마트들이 밀리지 않는다.
핵심은 마트들이 서로 얽히는 것을 정책적으로 막는 것이다. 그리고 정책적으로 원천을 갱신하는 거다. 이렇게 하면, 개발 효율성과 운영 효율성을 모두 가져갈 수 있을 것 같다. 그리고 불필요한 시스템은 그때그때 폐기한다. 그리고 비슷한 성격을 가진 시스템은 고도화를 통해 통합한다. 마트 간 영향도가 0이기 때문에, 고도화 프로젝트에 대한 추가 개발 리소스는 크지 않다.
댓글 없음:
댓글 쓰기