Limit(0): 클라우드 인프라의 유연성 및 가용성 극대화, 오토 스케일링(Auto Scaling)

1. 수요 대응형 인프라 관리, 오토 스케일링의 개요

정의: 트래픽 변동이나 시스템 부하 등 미리 정의된 조건에 따라 컴퓨팅 자원(Instance, Container 등)을 자동으로 증설(Scale-out)하거나 감축(Scale-in)하는 클라우드 핵심 기술.
핵심 가치: * 비용 최적화: 실제 수요에 맞춰 자원을 사용함으로써 불필요한 과금 방지(Pay-as-you-go).
- 가용성 확보: 갑작스러운 트래픽 폭주 시에도 서비스 중단 없이 안정적인 운영 가능.
- 운영 자동화: 관리자의 개입 없이 인프라 부하를 실시간 모니터링하여 대응.

구성 요소	주요 내용	비고
시작 설정 (Launch Config)	어떤 자원을 생성할 것인가? (AMI, 인스턴스 타입, 키 페어, 보안 그룹 등)	자원의 명세서
오토 스케일링 그룹 (Group)	어디에, 얼마나 생성할 것인가? (VPC, 서브넷, 최소/최대/원하는 용량)	관리의 논리적 단위
스케일링 정책 (Policy)	언제 늘리고 줄일 것인가? (CPU 사용량 > 70%, 특정 시간대 등)	트리거(Trigger) 조건

[Image comparison of Scale-out vs Scale-up architecture in cloud computing]

| 구분 | 수평 확장 (Scale-out) | 수직 확장 (Scale-up) |

| :--- | :--- | :--- |

| 개념 | 장비의 대수를 늘리는 방식 (1대 → N대) | 장비 자체의 성능을 높이는 방식 (CPU 2core → 8core) |

| 장점 | 이론상 무한 확장 가능, 장애 내결함성 우수 | 설계가 단순하고 데이터 정관성 유지가 쉬움 |

| 단점 | 로드 밸런싱 필수, 데이터 동기화 복잡성 | 확장의 한계 존재, 변경 시 서비스 중단 필요 |

| 적합성 | 웹/WAS 서버, 무상태(Stateless) 앱 | DB 서버, 고성능 연산 필요 시스템 |

Cloud Native의 완성: 단순 VM 수준을 넘어 Kubernetes(HPA: Horizontal Pod Autoscaler) 기반의 컨테이너 오토 스케일링으로 진화 중이며, 서버리스(Serverless) 환경에서는 완전 자동화된 스케일링이 기본 제공됨.
결언: 오토 스케일링은 단순히 자원을 늘리는 도구가 아니라, 비즈니스의 **'민첩성(Agility)'**과 **'안정성'**을 동시에 확보하기 위한 클라우드 거버넌스의 핵심 요소로 다루어져야 함.

Limit(0)