[디지털경제뉴스 박시현 기자] HPE는 5세대 AMD 에픽 프로세서와 AMD 인스팅트 MI325X 가속기를 탑재한 ‘HPE 프로라이언트 컴퓨트 XD685’ 서버를 출시했다
이 새로운 HPE 서버는 대규모 언어 모델(LLM) 학습이나 자연어 처리 및 멀티 모달 학습에 필요한 고성능의 에너지 효율적인 AI 클러스터를 신속하게 배포할 수 있도록 설계됐다.
HPE 프로라이언트 컴퓨트 XD685는 HPE가 설계한 새로운 모듈형 섀시를 통해 대규모 AI 모델 학습 및 조정 프로젝트에 신속한 솔루션을 제공한다. 모듈형의 컴팩트한 5U 섀시는 솔루션의 시장 출시 시간을 단축시키고 다양한 GPU, CPU, 구성 요소, 소프트웨어 및 냉각 방식을 수용할 수 있는 유연성을 제공한다. 또한 수십 년간 축적된 HPE의 직접 수냉 방식(DLC) 노하우와 HPE iLO의 보안 혁신을 결합해 지속가능하고 안전한 고성능 솔루션을 구현한다.
HPE 프로라이언트 컴퓨트 XD685의 특징은 다음과 같다.
▪더 적은 GPU로 대규모 AI 모델 실행: AMD CDNA 3 아키텍처로 구동되는 AMD 인스팅트 MI325X 가속기는 학습 및 추론 작업에서 뛰어난 AI 성능과 효율성을 제공한다. MI325X 가속기는 초당 6테라바이트의 메모리 대역폭을 갖춘 HBM3e 메모리 용량을 통해 성능을 최적화하고 총소유비용을 줄여준다.▪직접 수냉 방식으로 효율성 향상: 직접 수냉 방식 옵션은 조직이 증가하는 전력 요구 사항을 충족하고 지속가능성 목표를 달성하며 운영비용을 낮추도록 지원한다. 이는 HPE의 수십 년간의 전문성과 세계 최대 액체 냉각 IT 환경 배포에서의 시장 리더십을 활용한 결과다.
▪배포 및 운영 가속화: HPE 서비스는 대규모 AI 클러스터를 전 세계 어디에서나 안정적이고 우수한 운영으로 설치 및 배포할 수 있도록 모든 범위의 맞춤형 유연성 서비스를 제공한다. 전문 서비스 팀이 공장에서 솔루션을 구축, 통합, 검증, 테스트 및 맞춤화해 현장 배포 시간을 단축시킨다.
▪증가하는 보안 위협에 대비: HPE iLO를 통해 HPE 프로라이언트 컴퓨트 XD685 시스템을 안전하게 관리, 높은 수준의 보안 혁신과 원활한 관리를 제공한다.
▪랙 집적도 최적화: HPE가 설계한 5U 서버 섀시는 랙당 8노드 구조로 컴팩트하게 구성되어 8웨이 GPU 시스템의 랙 집적도를 극대화한다. HPE 프로라이언트 컴퓨트 XD685는 8개의 AMD 인스팅트 MI325X 또는 AMD 인스팅트 MI300X 가속기, 최신 AMD 에픽 9005 시리즈 프로세서 2개, 공랭 혹은 직접 수냉 방식 방식을 지원한다.
▪대규모 AI 클러스터 관리 간소화: HPE 퍼포먼스 클러스터 매니저는 완전 통합 시스템 관리 소프트웨어로, 베어메탈에서 자동화된 설정으로 복잡한 시스템을 빠르게 운영할 수 있도록 지원하며, 상세한 텔레메트리, GPU 스트레스 테스트 등으로 클러스터를 안정적으로 유지 및 운영한다.
HPE의 HPC 및 AI 인프라 솔루션 부문 수석 부사장 트리시 댐크로거는 “대규모 언어 모델을 효율적으로 학습하려면 뛰어난 확장성, 대규모 병렬 컴퓨팅 성능, 그리고 HPE의 고성능 컴퓨팅 솔루션만이 제공할 수 있는 독보적인 서비스가 필요하다”며, “HPE는 AMD와 협력해 프로라이언트 컴퓨트 XD685로 혁신을 확장하고, AI 모델 개발자 시장의 수요에 부응하며, 산업 전반에서 과학과 공학의 혁신을 가속화할 것”이라고 말했다.