1. 디지털 행정 안정을 위한 제도적 나침반, 공공 SLA의 개요
가. 공공 SLA(Service Level Agreement)의 개념
행정·공공기관이 발주하는 정보시스템의 운영·유지관리(위탁) 계약 시, 공급업체와 발주기관 간에 제공할 서비스의 수준(가용성, 장애 처리 등)을 정량적 지표로 정의하고, 이행 여부에 따른 상벌 체계를 명시하는 서비스수준협약.
기존 민간 중심의 SLA 형식을 공공 서비스의 공익성과 대국민 연속성에 맞추어 표준화한 제도이다.
나. 공공 SLA 도입의 필요성
| 분류 | 필요성 및 기대 효과 | 세부 내용 |
| 행정 안전성 관점 | 반복적 전산망 장애 원천 차단 | * 사후 약방문식 대처를 탈피하여, 상시적인 예방 점검과 정량적 가용성 관리를 통한 행정망 신뢰도 회복 |
| 제도 통제 관점 | 공급업체 책임성(Accountability) 강화 | * "장애가 안 나면 그만"이라는 소극적 유지보수에서 탈피, 지표 기반의 적극적 장애 대응 및 상벌 구조 확립 |
| 자원 배분 관점 | 예산 및 자원의 효율적 차등 배분 | * 모든 시스템에 동일한 예산을 투입하던 방식에서 벗어나, 국가 중요도에 따른 전략적 투자 근거 마련 |
2. 정보시스템 등급 분류 기준과 등급별 SLA 적용 방식
정부는 「전자정부법」 개정을 통해 국가 행정 및 대국민 영향도에 따라 정보시스템을 등급화하고, 이에 차등화된 SLA를 적용한다.
가. 정보시스템 등급 분류 기준 (1등급~4등급)
정보시스템의 중요도는 '이용자 수', '업무 중단 시 파급 효과(행정 마비, 재산 피해)', '대체 가능 여부'를 종합하여 행정안전부 가이드라인에 따라 분류된다.
1등급 (국가 핵심 시스템): 장애 시 국가 행정 기능이 마비되거나 대규모 대국민 혼란이 발생하는 시스템 (예: 정부24, 주민등록시스템, 국가재정시스템 등).
2등급 (주요 업무 시스템): 다수의 기관·국민이 이용하며, 중단 시 특정 행정 구역이나 특정 도메인 업무에 심각한 차질을 빚는 시스템.
3등급 (일반 지원 시스템): 특정 기관 내부 직원이 주로 사용하거나, 일시 중단되어도 수동 전환 등 대체 수단이 존재하는 시스템.
4등급 (단순 홍보/소규모 시스템): 이용률이 낮고, 중단 시 파급 효과가 미미한 대민 홍보용 웹사이트 등.
나. 등급별 SLA 차등 적용 방식
1·2등급 (고가용성 집중 통제): 실시간 가용률 측정, 밀리초($ms$) 단위 모니터링, 엄격한 페널티(위약금) 적용 및 이중화·재해복구(DR) 연동 의무화.
3·4등급 (관리 효율성 중심): 핵심 지표 위주의 간소화된 SLA 적용, 예산 범위를 고려한 정성·정량 지표의 탄력적 운영.
3. 공공 SLA 표준안의 주요 내용 및 적용 시 고려사항
가. 공공 SLA 표준안의 3대 핵심 내용
| 핵심 항목 | 표준안 가이드라인 주요 내용 | 비고 (실무적 적용 기준) |
| 1. 가용률 (Availability) | * 1등급 기준 연간 $99.99\%$ ($4\text{Nines}$) 이상의 가용성 요구 (연간 총 장애 시간 52분 이내 통제) * 3·4등급은 $99.0\% \sim 99.5\%$ 수준 책정 | * 계획된 정기 점검 시간은 가용률 계산 산식에서 제외하는 기준 명확화 |
2. 장애조치 시간 (MTTR) | * 장애 발생 시점부터 정상 서비스 복구까지의 목표 시간(MTTR)을 등급별 차등 정의 * 1등급 최우선 장애: 즉시 대응 및 20분 이내 임시 복구/우회로 확보 | * 단순 복구가 아닌 '대국민 서비스 정상화' 시점을 기준으로 측정 |
3. 위약금 체계 (Penalty & Reward) | * SLA 지표 미달 시, 유지보수 기성금에서 정량적 감액(위약금 차감) 방식 도입 * 상벌제(Incentive) 병행: 목표 초과 달성 및 장애 제로 달성 시 인센티브 부여 | * 중소 IT 기업의 생존권을 위협하지 않는 선에서 실효성 있는 요율 설계 |
나. 공공 SLA 적용 시 실무적 고려사항
객관적 측정 도구(SMS/APM)의 신뢰성 확보: 장애 시간 및 가용률 측정 시 발주기관과 공급업체 간의 이견을 방지하기 위해, 제3의 모니터링 도구(Application Performance Monitoring)의 측정 로그를 공인 기준으로 삼아야 함.
클라우드 네이티브 전환에 따른 책임 한계 명확화: 공공 인프라의 클라우드(공공 클라우드 존) 이전이 가속화됨에 따라, [CSP(인프라 장애) vs MSP(운영 장애) vs 주사업자(애플리케이션 장애)] 간의 R&R(역할과 책임)을 분리하여 SLA 지표를 설계해야 함.
예산 구조의 현실화: 민간 수준의 엄격한 SLA와 $99.99%$의 가용성을 요구하기 위해서는 대기업 참여 제한 완화 및 적정 유지보수 대가(대가 산정 요율 현실화)가 예산 편성에 선제적으로 반영되어야 함.
4. 기술사적 제언: 2027년 의무화 안착을 위한 발전 방향
SLM(Service Level Management) 인프라의 제도적 자산화: 공공 SLA는 계약서상의 명시에 그쳐서는 안 된다. 범정부 차원의 통합 SLM 포털을 구축하여 각 기관별 정보시스템 등급 현황과 실시간 SLA 달성 지표를 모니터링하고, 이를 범정부 EA(엔터프라이즈 아키텍처) 및 공공기관 경영평가 지표와 연계하여 실행력을 담보해야 한다.
디지털 보편적 역량 강화를 위한 차세대 가드레일 확립: 향후 인공지능(AI)과 대형언어모델(LLM)이 공공 서비스에 결합됨에 따라, 전통적인 인프라 중심의 SLA를 넘어 AI 서비스의 정확도, 환각 발생률, 프라이버시 유출 방지 등 '지능형 서비스 수준 지표(SLI)'를 공공 SLA 표준안에 단계적으로 수용하는 선제적 제도 고도화가 필요하다.
댓글 없음:
댓글 쓰기