클라우드 컴퓨팅에서 기억하고 싶은 내용
시스템 중단
Portal, 금융 등 은 상시 서비스를 제공해야 한다
or 서비스 품질 및 신뢰도 저하
중단 되는 경우
물리 서버 이관
가능한 용량 초과
유지보수를 위한 일시적 다운
무중단 서비스
온프레미스 경우
이중화 서버 구조 구축
클라우드 경우
동작중인 서버 복제
새 가상 서버 생성해서 복제
이중화 구조 지원
무중단 서버 재배치 구조
기존의 데이터, 소프트웨어 새로운 VM로 복제
장점
안정적 서비스 이관
로드 밸런서 자동
무정지 서비스
클라우드 서비스 장애 원인
- 물리 서버 장애
- 장비 노후 및 무응답
- 물리적 고장
어떡하나?
장애 방지 시스템
- 고장나도 정상적 혹은 부분적으로 기능 수행
장애 조치 시스템
- 이상이 생기면 예비 시스템으로 전환
동적 장애 감지
물리 리소스 장애
메모리, 디스크, 장비 노후 등
방대한 장비들 있는 데이터센터 장애 발생시
=> 항상 원인 찾고 문제 해결하는 것은 비효율
장애 시나리오 만들고 조치 방안에 따라 자동화 필요!
하트비트 모니터링
대표적으로 Zoo Keeper
하트비트 보내고 응답 제대로 안오면 장애 발생했다고 여기고 조치
'Web Dev > Cloud Computing :: 클라우드 컴퓨팅' 카테고리의 다른 글
클라우드 컴퓨팅 12강 :: Serverless (0) | 2022.11.03 |
---|---|
클라우드 컴퓨팅 11강 :: Azure, AWS, GCP (0) | 2022.11.01 |
클라우드 컴퓨팅 9강 :: 리소스 풀링, 오토 스케일링, 클라우드 버스팅 (0) | 2022.10.25 |
클라우드 컴퓨팅 8강 :: 중간 정리 (0) | 2022.10.18 |
클라우드 컴퓨팅 7강 :: Storage, 가용성, 오토스케일 (0) | 2022.10.18 |