Cloud

[Cloud] 오토 스케일링이란??

Jeong Jeon
반응형

오토스케일링이란?

서버의 과부하나 장애 등 서비스가 불능상태가 되면 자동으로 서버를 복제/추가 하여 서버를 늘려주는 작업

이부분에서 On premise보다 Cloud가 좋은 점 한가지를 깨달을수 있다.

온프레미스의 단점

  • 장비 유지보수비가 비싸다
  • 서버 증설을 위한 작업이 까다롭다

Onpremise는 서버 증설을 위한 작업이 까다롭다, 이때 Scale up과 Scale out 개념이 나오는데, 한번 확인해보자

 

스케일업(scale-up) VS 스케일아웃(scale-out)

1. Scale up : 유저들의 트래픽을 보다 신속하게 처리하기 위해 고속의 프로세서를 장착하는 전략

2. Scale out : 같은 서버를 여러 대 복제하여 트래픽을 분산하는 전략

어떤 방향으로 전략을 선택하느냐는 상황에 따라 맞추어야될것이다.

 

서버를 업그레이드 할건지, 서버대수를 늘릴건지는 인프라 엔지니어가 판단하겠지만,

해당 작업보다 클라우드 환경에서 자동으로 AutoScaling이 되는것이 훨씬 편하지 않겠는가!

Onpremise일 경우 서버의 과부하가 일어남과 동시에 쓱싹 바꿔버릴수도 없는 노릇이다.

이렇기 때문에 Cloud의 AutoScaling이 각광받고 있는것 같다.

 

간단하게 AWS의 오토스케일링 그룹속성 항목까지만 확인해보자

 

AWS 오토스케일링 그룹속성설명

속성 설명
Desired 오토스케일링 시 서버 수 지정
Launch Configuration 오토스케일링 그룹에서 생성될 서버의 사양/설정 정의
MinSize 오토스케일링 그룹의 최소 유지 서버 수 (Desired > = MinSize)
MaxSize 오토스케일링 그룹의 최대 보유 서버 수 (Desired < = MaxSize)
Health Check Type 오토스케일링 그룹의 서비스에 대한 정상 구동 여부 체크 방식 지정
- 서버 정상 구동 여부 체크 방식
- 로드밸런서(Load Balancer)에 의한 URL 헬스 체크 방식
Health Check Grace Time 오토스케일링 그룹에서 신규 생성된 서버가 정상적인 서비스를 실행하기 위해 필요한 초기 준비 시간(이 시간 동안은 헬스 체크 대상에서 제외)
Cool Down Time 오토스케일링에 의해 서버가 확장 및 축소될 때 서비스가 안정화 되기까지의 워밍업 시간(모니터링 서비스에서 발생한 알람이 무시되며 서버 확장 후 그룹 내 서비스가 정확한 부하분산을 할 수 있을 때까지 대기)

 

반응형