HPC & GPU Engineering/AI Infrastructure Engineer

[HPC/GPU 클러스터 운영 Scheduling Deep Dive 10편] Energy-Aware Scheduling – Green HPC 운영 전략

ygtoken 2025. 8. 20. 23:44
728x90

 

에너지 최적화가 중요한 이유

 

HPC 및 GPU 클러스터는 막대한 전력 소모를 동반합니다. 최신 NVIDIA H100 GPU 한 장만 해도 700W 이상을 소모하며, 수백~수천 장 규모의 클러스터는 메가와트 단위의 전력 소비로 이어집니다. 운영 비용뿐 아니라 ESG(Environmental, Social, Governance) 측면에서도 에너지 효율은 점점 더 중요한 주제가 되고 있습니다.

 

따라서 단순히 Job을 빠르게 처리하는 것을 넘어, 전력 효율까지 고려한 스케줄링(Energy-Aware Scheduling) 전략이 필요합니다. 이를 통해 운영 비용 절감, 탄소 배출 저감, 그리고 지속 가능한 HPC 인프라 운영이 가능해집니다.

 


 

Energy-Aware Scheduling의 개념

 

Energy-Aware Scheduling은 Job 스케줄링 시 성능과 에너지 소비를 동시에 최적화하는 접근 방식입니다. 단순히 Job 완료 시간을 줄이는 것이 아니라, Job의 자원 사용 패턴과 전력 효율을 고려하여 배치합니다.

 

주요 기법은 다음과 같습니다.

 

  1. DVFS(Dynamic Voltage and Frequency Scaling): GPU/CPU 클럭을 동적으로 조정하여 불필요한 소비 전력을 줄입니다.
  2. Power Capping: Job 실행 시 GPU/노드별 최대 전력 사용량을 제한합니다.
  3. 에너지 효율 기반 우선순위: Job이 단위 전력당 성능(Performance per Watt)이 높은 경우 우선 실행합니다.
  4. 냉각/열 분산 고려: 노드 간 열 부하를 균형 있게 분산하여 냉각 효율을 높입니다.

 


 

Slurm에서의 에너지 관리

 

Slurm은 JobAcctGatherEnergy 플러그인을 통해 Job 단위 에너지 사용량을 측정할 수 있으며, scontrol 명령을 통해 노드별 Power Capping 설정이 가능합니다.

# 노드별 Power Cap 설정 (와트 단위)
scontrol update NodeName=node01 Power=400

또한 Slurm Energy Saving 모드(SchedulerParameters=power_save)를 활용하면, Idle 노드를 자동으로 저전력 상태로 전환할 수 있습니다.

# slurm.conf 예시
SchedulerParameters=power_save
SuspendTime=300
ResumeTimeout=60

위 설정은 노드가 5분간 Idle 상태면 Suspend 모드로 전환하고, Job이 들어오면 60초 안에 다시 Resume되도록 합니다.

 


 

GPU Power Management

 

NVIDIA GPU는 nvidia-smi를 통해 전력 제한을 직접 설정할 수 있습니다.

# GPU 전력 제한을 250W로 설정
nvidia-smi -i 0 -pl 250

또한 CUDA 12.x 이상에서는 API를 통해 Job 단위 전력 사용량을 측정하거나, DVFS 기반 성능-전력 프로파일을 제어할 수 있습니다. 이를 스케줄러와 연동하면 자동화된 Power-Aware Scheduling이 가능합니다.

 


 

실제 적용 사례

 

  • 대학 슈퍼컴퓨터 센터: 에너지 절감을 위해 Idle 노드 자동 Suspend를 활성화하여 연간 전력 사용량을 15% 절감했습니다.
  • AI 연구소: Inference Job은 GPU 전체 성능이 필요하지 않음을 감안해 Power Cap을 적용, 전력 소모를 30% 줄이면서도 SLA를 충족했습니다.
  • 클라우드 GPU 서비스 업체: 고객에게 “Green QoS”를 제공하여, 전력 효율 모드에서 Job을 실행하면 비용을 할인해주는 모델을 도입했습니다.

 


 

장점과 단점

 

장점

 

  • 전력 비용 절감과 ESG 목표 달성에 기여합니다.
  • Idle 자원 전력 소모를 줄여 효율성을 높입니다.
  • Green QoS와 같은 차별화된 서비스 모델로 확장 가능합니다.

 

단점

 

  • 성능과 전력 효율 간 트레이드오프가 존재합니다.
  • DVFS 및 Power Cap은 일부 Job에서 성능 저하를 유발할 수 있습니다.
  • 전력 제어와 모니터링 설정이 잘못되면 Job 안정성에 영향을 줄 수 있습니다.

 


 

실무 팁과 주의사항

 

  1. 워크로드별 전력 특성 분석
  2. Training, Inference, 시뮬레이션 Job의 전력 사용 패턴을 모니터링해 차별화된 정책을 적용해야 합니다.
  3. Green QoS 제공
  4. 사용자가 비용 절감을 선택할 수 있도록 “에너지 효율 모드” QoS를 제공하면, 운영과 비용 관리에 긍정적입니다.
  5. 모니터링 체계 구축
  6. Slurm Energy 플러그인과 Grafana 대시보드를 연계하여 Job 단위 전력 사용량을 시각화해야 합니다.
  7. 냉각 효율 고려
  8. 단순 전력 제어뿐 아니라 노드 간 열 부하를 고려해 Job을 분산 배치하면 운영 효율성이 높아집니다.
  9. 자동화와 정책화
  10. Power Cap, Suspend/Resume 기능을 수동이 아니라 자동화된 정책으로 운영해야 안정성을 확보할 수 있습니다.

 


 

정리하며

 

Energy-Aware Scheduling은 HPC/GPU 클러스터 운영에서 성능과 지속 가능성을 동시에 달성하는 핵심 전략입니다. DVFS, Power Capping, Idle Node 관리, Green QoS 등을 종합적으로 활용하면, 에너지 효율성을 크게 높일 수 있습니다. 운영자는 단순 성능 극대화에서 벗어나, 클러스터의 비용 절감·탄소 절감·지속 가능성까지 고려한 Green HPC 전략을 설계해야 합니다.

 

 

728x90