쿠버네티스 클러스터에서 노드(Node)는 애플리케이션을 실행하는 핵심 인프라입니다.노드 장애가 발생하면 워크로드가 중단될 위험이 있으며, 이를 자동으로 감지하고 복구하는 전략이 필요합니다.이 글에서는 노드 장애 시 자동 복구 및 리소스 재배치 전략을 수립하는 방법을 다룹니다. 📌 글에서 다루는 상황들 1. 노드 장애 감지 및 자동 복구 설정 (Node Problem Detector & Cluster Autoscaler 활용) 2. Pod Disruption Budget(PDB)를 활용한 안정적인 롤링 업데이트 및 장애 복구 3. kubectl 및 로그 분석을 활용한 노드 장애 디버깅 및 리소스 재배치 트러블슈팅 각 문제를 실무에서 바로 활용할 수 있도록 Manifest 템플릿과 예상 결과 값을 제공합..