Web Dev/Cloud Computing :: 클라우드 컴퓨팅

클라우드 컴퓨팅 10강 :: 무중단 서비스, 무정지 서비스, 동적 장애 감지

HJPlumtree 2022. 10. 27. 18:11

클라우드 컴퓨팅에서 기억하고 싶은 내용

 

 

시스템 중단

Portal, 금융 등 은 상시 서비스를 제공해야 한다

or 서비스 품질 및 신뢰도 저하

 

중단 되는 경우

물리 서버 이관

가능한 용량 초과

유지보수를 위한 일시적 다운

 

 

무중단 서비스

온프레미스 경우

이중화 서버 구조 구축

 

클라우드 경우

동작중인 서버 복제

새 가상 서버 생성해서 복제

이중화 구조 지원

 

 

무중단 서버 재배치 구조

기존의 데이터, 소프트웨어 새로운 VM로 복제

 

장점

안정적 서비스 이관

로드 밸런서 자동

 

 

무정지 서비스

클라우드 서비스 장애 원인

  • 물리 서버 장애
  • 장비 노후 및 무응답
  • 물리적 고장

 

어떡하나?

장애 방지 시스템

- 고장나도 정상적 혹은 부분적으로 기능 수행

 

장애 조치 시스템

- 이상이 생기면 예비 시스템으로 전환

 

 

동적 장애 감지

물리 리소스 장애

메모리, 디스크, 장비 노후 등

 

방대한 장비들 있는 데이터센터 장애 발생시

=> 항상 원인 찾고 문제 해결하는 것은 비효율

장애 시나리오 만들고 조치 방안에 따라 자동화 필요! 

 

 

하트비트 모니터링

대표적으로 Zoo Keeper

하트비트 보내고 응답 제대로 안오면 장애 발생했다고 여기고 조치