HPA 14

📌 [ReplicaSet 심화편 #3] ReplicaSet과 HorizontalPodAutoscaler(HPA)를 활용한 자동 확장

1️⃣ 개요 쿠버네티스 환경에서 트래픽이 증가하면 Pod 개수를 동적으로 조정하여 서비스 성능을 최적화하는 것이 중요합니다.ReplicaSet은 Pod의 개수를 유지하는 역할을 하지만, 트래픽 변화에 따라 자동으로 Pod 개수를 조절할 수는 없습니다. 이를 해결하기 위해 HorizontalPodAutoscaler(HPA) 를 활용하면 CPU 또는 메모리 사용량을 기준으로 **자동 확장(Auto Scaling)**을 수행할 수 있습니다.이번 글에서는 ReplicaSet과 HPA를 활용하여 Pod 개수를 자동으로 조절하는 방법을 설명하겠습니다. 2️⃣ ReplicaSet과 HPA의 차이 ReplicaSet과 HPA는 Pod의 개수를 관리하는 역할을 하지만, 동작 방식에 차이가 있습니다. 📌 ReplicaS..

[13편] 운영 자동화 (Airflow & Kubernetes)

이 글에서는 PostgreSQL pgvector 기반 벡터 검색 시스템을 Airflow와 Kubernetes를 활용하여 자동화하는 방법을 다룹니다.특히, Airflow로 벡터 데이터를 자동 업데이트하고, Kubernetes CronJob & HPA(Auto Scaling)를 적용하여 운영을 최적화하는 실무적인 방법을 정리합니다. ✅ Airflow를 활용한 벡터 데이터 자동 업데이트 및 관리✅ Kubernetes CronJob을 활용한 주기적 벡터 데이터 백업 & 최적화✅ HPA(Auto Scaling) 적용으로 AI 검색 시스템의 자동 확장 🚀 1. Airflow를 활용한 벡터 데이터 자동 업데이트 🔹 1️⃣ Airflow를 활용하는 이유  ✅ AI 검색 시스템에서 벡터 데이터는 지속적으로 추가 & ..

Kubernetes 리소스 시리즈 #14: Horizontal & Vertical Pod Autoscaler (오토스케일링 및 모니터링 리소스)

Kubernetes에서는 애플리케이션의 부하에 따라 자동으로 리소스를 조정할 수 있습니다.이를 위해 **HPA(Horizontal Pod Autoscaler)와 VPA(Vertical Pod Autoscaler)**를 사용합니다.이번 글에서는 HPA와 VPA의 개념, 차이점, 그리고 실전 활용법을 정리하겠습니다.🔹 HPA (Horizontal Pod Autoscaler)란?**HPA(Horizontal Pod Autoscaler)**는 CPU, 메모리 등의 사용량을 기준으로 Pod의 개수를 자동으로 조정하는 Kubernetes 리소스입니다.✔️ 트래픽 증가 시 자동으로 Pod 개수를 증가✔️ 트래픽 감소 시 불필요한 Pod를 줄여 리소스 절약✔️ Deployment, StatefulSet 등의 리소스에..

📌 Kubernetes HPA: 자동 확장으로 효율적인 리소스 관리하기

1️⃣ Kubernetes에서 자동 확장이 필요한 이유? 애플리케이션의 트래픽은 예측하기 어렵습니다.사용자가 갑자기 증가하면 서비스 장애가 발생할 수 있고, 반대로 사용자가 적을 때 불필요한 리소스를 사용하면 비용이 낭비됩니다.  Kubernetes에서는 **HPA(Horizontal Pod Autoscaler)**를 사용하여 트래픽 변화에 맞춰 자동으로 Pod 개수를 조절할 수 있습니다. ✅ 트래픽이 많아지면 자동으로 Pod를 추가✅ 트래픽이 줄어들면 자동으로 Pod를 감소✅ CPU, 메모리 사용량을 기준으로 확장 가능 이제 Kubernetes에서 HPA를 설정하는 방법을 살펴보겠습니다!  2️⃣ Kubernetes HPA란? 📌 **HPA(Horizontal Pod Autoscaler)**는 Pod..

728x90