AMD가 에이전틱 AI 확산에 따른 데이터센터 인프라 변화 방향을 제시했다. 단순 GPU 중심 구조에서 벗어나 랙 단위 CPU 성능과 처리 능력이 중요하다는 점을 강조했다.
GPU 중심 벗어난 AI 인프라 구조 변화
100kW 랙 기준 처리량 경쟁력 제시
AMD가 에이전틱 AI 확산에 따른 데이터센터 인프라 변화 방향을 제시했다. 단순 GPU 중심 구조에서 벗어나 랙 단위 CPU 성능과 처리 능력이 중요하다는 점을 강조했다.
AMD는 10일 에이전틱 AI 환경에서 CPU 기반 인프라의 역할이 확대되고 있으며 랙 스케일 성능이 핵심 지표로 부상하고 있다고 밝혔다.
에이전틱 AI는 모델 추론뿐 아니라 다양한 서비스 계층으로 구성된다. 오케스트레이션, 데이터베이스, 웹 서비스, API, 캐시, 미들웨어 등 다수의 시스템이 동시에 작동한다.
이들 시스템은 대부분 CPU 자원 의존도가 높으며, 동시에 실행되는 에이전트 수에 따라 인프라 규모가 확장되는 구조다.
AMD는 이러한 환경에서 GPU 성능보다 CPU 처리 능력이 전체 시스템 확장성을 결정하는 요소라고 설명했다.
AMD는 데이터센터 성능 평가 기준으로 ‘랙 단위 처리량’을 제시했다. 실제 데이터센터는 전력, 냉각, 공간 등 제약 조건 속에서 구축되기 때문이다.
이에 따라 단일 칩 성능보다 “100kW 랙에서 얼마나 많은 작업을 처리할 수 있는지”가 중요하다고 밝혔다.
AMD에 따르면 동일 조건에서 EPYC 9965는 엔비디아 베라 기반 시스템 대비 약 2.37배, 인텔 제온 대비 약 1.6배 수준의 랙 처리량을 보이는 것으로 분석됐다.
차세대 EPYC ‘베니스(Venice)’는 해당 격차를 더 확대할 것으로 예상된다고 설명했다.
AMD는 EPYC 기반 시스템이 랙당 높은 코어 집적도를 제공하는 점을 강조했다.
현재 EPYC ‘튜린(Turin)’ 기반 시스템은 랙당 2만7000개 이상의 CPU 코어 구성이 가능하며, 차세대 제품은 3만6000개 이상으로 확장될 것으로 전망된다.
이러한 고밀도 구조는 동일 전력 예산 내에서 더 많은 서비스와 에이전트를 처리할 수 있는 기반이 된다고 AMD는 설명했다.
AMD는 해당 인프라가 별도의 신규 아키텍처 없이 기존 x86 기반 환경에서 구축 가능하다는 점도 강조했다.
이는 소프트웨어 호환성을 유지하면서 인프라 전환 부담을 줄이는 요소로 언급됐다.
AMD는 에이전틱 AI 환경에서는 단일 구성 요소 성능보다 CPU·GPU·네트워크를 포함한 전체 시스템 균형과 랙 단위 효율이 중요하다고 밝혔다.