Web Dev/Cloud Computing :: 클라우드 컴퓨팅
클라우드 컴퓨팅 10강 :: 무중단 서비스, 무정지 서비스, 동적 장애 감지
HJPlumtree
2022. 10. 27. 18:11
클라우드 컴퓨팅에서 기억하고 싶은 내용
시스템 중단
Portal, 금융 등 은 상시 서비스를 제공해야 한다
or 서비스 품질 및 신뢰도 저하
중단 되는 경우
물리 서버 이관
가능한 용량 초과
유지보수를 위한 일시적 다운
무중단 서비스
온프레미스 경우
이중화 서버 구조 구축
클라우드 경우
동작중인 서버 복제
새 가상 서버 생성해서 복제
이중화 구조 지원
무중단 서버 재배치 구조
기존의 데이터, 소프트웨어 새로운 VM로 복제
장점
안정적 서비스 이관
로드 밸런서 자동
무정지 서비스
클라우드 서비스 장애 원인
- 물리 서버 장애
- 장비 노후 및 무응답
- 물리적 고장
어떡하나?
장애 방지 시스템
- 고장나도 정상적 혹은 부분적으로 기능 수행
장애 조치 시스템
- 이상이 생기면 예비 시스템으로 전환
동적 장애 감지
물리 리소스 장애
메모리, 디스크, 장비 노후 등
방대한 장비들 있는 데이터센터 장애 발생시
=> 항상 원인 찾고 문제 해결하는 것은 비효율
장애 시나리오 만들고 조치 방안에 따라 자동화 필요!
하트비트 모니터링
대표적으로 Zoo Keeper
하트비트 보내고 응답 제대로 안오면 장애 발생했다고 여기고 조치