엔비디아 GTC 타이페이·컴퓨텍스 2026 특집① - Cosmos 3·RTX Spark·Vera Rubin, AI 팩토리·PC·로봇·자율주행의 질서 바꾼다

[엔비디아 GTC 타이페이·컴퓨텍스 2026 특집①]Cosmos 3·RTX Spark·Vera Rubin, AI 팩토리·PC·로봇·자율주행의 질서 바꾼다

기사입력 2026.06.04 10:10

풀스택 AI 생태계 선언, 엔비디아 GPU 기업 넘어 AI 인프라 기업 전환
로봇·자율주행을 위한 물리 모델 제시, 로컬 AI 에이전트 PC 시장 겨냥

[편집자주]엔비디아는 GTC 타이페이 2026에서 Cosmos 3, RTX Spark, Vera Rubin, Vera CPU, Drive Hyperion, DSX 등 8대 신기술을 공개하며 AI 풀스택 전략을 공식화했다. 이번 발표는 GPU 성능 경쟁을 넘어 PC, 로봇, 자율주행, 데이터센터, 반도체 팹까지 연결하는 AI 인프라 플랫폼 선언으로 평가된다.

▲NVIDIA GTC 타이페이 2026 기조연설에서 젠슨 황 CEO가 발표하고 있다.(사진 : 엔비디아)

2026년 컴퓨텍스의 주인공은 단순한 신형 GPU가 아니었다. 엔비디아가 GTC 타이페이에서 공개한 메시지는 훨씬 더 구조적이었다. AI는 이제 클라우드 데이터센터 안에서만 작동하는 거대 모델이 아니라, 노트북, 로봇, 자동차, 반도체 팹, 전력망과 연결된 산업 인프라 전체로 확장되고 있다.

엔비디아는 6월1일부터 4일까지 대만 타이페이에서 NVIDIA GTC Taipei 2026을 개최했다.

1일 진행된 기조연설에서 젠슨황 엔비디아 CEO는 Cosmos 3, RTX Spark, Vera Rubin, Vera CPU, Drive Hyperion, DSX, Vera BlueField-4 STX, TSMC 팹 AI 적용을 한꺼번에 제시하며 ‘칩을 파는 회사’가 아니라 ‘AI가 작동하는 전체 시스템을 파는 회사’로 스스로를 재정의했다.

■ 엔비디아가 판 것은 ‘칩’이 아니라 ‘AI 작동 체계’

GTC 타이페이 2026에서 엔비디아가 제시한 8대 신기술은 피지컬 AI 모델 Cosmos 3, 온디바이스 AI PC 슈퍼칩 RTX Spark, 차세대 AI 팩토리 플랫폼 Vera Rubin, 에이전트 전용 Vera CPU, 로보택시 플랫폼 Drive Hyperion, AI 팩토리 설계·운영 플랫폼 DSX, 보안 스토리지 Vera BlueField-4 STX, 그리고 TSMC 팹의 CUDA-X 기반 AI 도입으로 정리된다.

엔비디아 공식 자료에 따르면 GTC 타이페이를 ‘AI factories, scaling infrastructure, agentic and physical AI’를 다루는 행사로 설명했고, 젠슨 황은 GTC 타이페이 키노트에서 ‘자율 에이전트의 시대가 도래했다’고 선언했다.

이번 발표의 진짜 변화는 제품군의 폭이 아니라 제품 간 결합 방식이다.

예전 엔비디아 발표가 GPU 성능 향상, 신형 가속기, CUDA 생태계 확장에 초점이 있었다면, 이번에는 CPU, GPU, DPU, 네트워킹, 스토리지 보안, 로컬 PC, 로봇 학습 모델, 자율주행 시뮬레이션, 팹 자동화까지 하나의 AI 생산 시스템으로 묶었다.

■ 생성형 AI가 ‘보는 AI’에서 ‘물리 세계를 예측하는 AI’로 이동

Cosmos 3는 이번 발표에서 가장 상징적인 피지컬 AI 기술이다.

▲NVIDIA 코스모스 3은 세계 최초의 완전한 오픈 옴니모델로, 텍스트, 이미지, 비디오, 주변 음성, 액션을 고도의 물리 정확도로 이해하고 생성할 수 있다.(사진 : 엔비디아)

Cosmos 3는 텍스트, 비디오, 이미지, 음향, 행동 데이터를 단일 모델에서 처리하는 오픈 월드 파운데이션 모델이며, 기존 AI가 장면을 보고 이해하는 수준이었다면 Cosmos 3는 ‘다음에 무슨 일이 일어날지 예측하고 시뮬레이션’하는 데 초점을 둔다.

기술적으로 중요한 지점은 Cosmos 3가 단순한 비디오 생성 모델이 아니라는 점이다.

발표에 따르면 Cosmos 3는 트랜스포머 혼합 방식의 아키텍처를 쓰며, 추론 블록이 장면의 맥락을 파악한 뒤 생성 블록이 물리 법칙에 맞는 합성 데이터를 만들어낸다.

특히 로봇의 관절 각도, 그리퍼 위치, 궤적 좌표 같은 수치 데이터를 직접 생성하는 네이티브 액션 생성 기능이 핵심 차별점으로 제시됐다.

이는 로봇과 자율주행 개발 방식의 변화를 의미한다.

기존에는 실제 세계에서 위험하거나 희귀한 상황을 충분히 수집하기 어렵기 때문에 로봇과 자율주행차 학습에 한계가 있었다.

반면에 Cosmos 3가 충돌, 희귀 롱테일 시나리오, 산업용 로봇 작업 궤적, 실시간 카메라 스트림 이해에 활용될 수 있다면, 엔비디아가 말하는 피지컬 AI는 데이터 부족 문제를 합성 데이터와 시뮬레이션으로 돌파하는 방향으로 진화한다.

발표에는 Agile Robots의 Thor 3·FR3 휴머노이드 훈련, Linker Vision의 스마트 시티 카메라 분석, 자율주행용 충돌·희귀 시나리오 시뮬레이션이 적용 사례로 언급되어 있다.

과거 발표와 비교하면, Cosmos 3의 의미는 AI가 콘텐츠를 생성한다에서 ‘AI가 물리적 행동의 결과를 예측한다’로 무게중심이 이동했다는 데 있다.

기존 생성형 AI가 텍스트·이미지·비디오 생성에 머물렀다면, Cosmos 3는 로봇 행동 데이터와 물리 기반 시뮬레이션을 묶어 실제 세계의 의사결정 모델로 확장된다.

발표는 Cosmos 3가 VANTAGE-Bench와 TAR 챌린지에서 1위를 기록했고, Physics-IQ, R-Bench, PAI-Bench 등 월드 생성 벤치마크에서도 선두권이라고 설명했다.

■ RTX Spark: AI PC의 경쟁축이 ‘NPU 탑재’에서 ‘로컬 에이전트 실행’으로 전환

RTX Spark는 이번 GTC 타이페이에서 PC 시장에 던진 가장 직접적인 도전장이다.

▲엔비디아 RTX 스파크™(RTX Spark™)(사진 : 엔비디아)

발표에 따르면 RTX Spark는 1페타플롭 AI 연산 성능과 128GB 통합 메모리를 슬림 노트북과 소형 데스크톱에 구현하는 슈퍼칩이며, 블랙웰 RTX GPU와 20코어 Grace CPU를 NVLink-C2C로 직접 연결한 구조다.

RTX Spark는 엔비디아의 PC 프로세서 시장 진입을 상징한다. 엔비디아가 데이터센터 AI 칩 시장을 지배한 뒤, RTX Spark 슈퍼칩으로 개인용 컴퓨터의 메인 프로세서 영역에 진입하고 있으며, 이 칩이 Microsoft, Dell, HP, ASUS, Lenovo, MSI의 Windows PC에 탑재될 예정으로 알려졌다.

RTX Spark의 본질은 ‘더 빠른 노트북’이 아니라 ‘클라우드에 의존하지 않는 개인 AI 에이전트 실행 환경’이다.

발표에 따르면 RTX Spark는 1,200억 파라미터 LLM을 로컬에서 실행하고, 100만 토큰 컨텍스트를 처리하며, 12K 4:2:2 영상 편집과 90GB 규모 3D 장면 렌더링, 1440p 100fps AAA 게임 플레이, Photoshop·Premiere AI 성능 2배 향상을 목표로 한다.

여기서 과거 AI PC와의 차이가 분명해진다.

최근 몇 년간 AI PC 논의는 주로 NPU TOPS, 배터리 효율, 온디바이스 추론 정도에 머물렀다.

반면 RTX Spark는 대형 언어모델, 창작 워크플로우, 에이전트 실행, 보안 런타임, Windows 통합을 한꺼번에 묶는다.

RTX Spark는 OpenShell, Windows 보안 프리미티브, 작업 표시줄 통합을 통해 사용자가 에이전트 권한 범위를 정의하고 Windows 에이전트 경험에 직접 접근할 수 있도록 설계된 것이다.

젠슨 황은 RTX Spark에 대해 ‘Microsoft와 Nvidia가 PC를 재발명할 것’이라고 말했으며, 이 제품군이 40년 만의 완전히 재설계된 PC 라인이라고 전했다.

이 발언을 시장 관점에서 해석하면, 엔비디아는 PC의 주도권을 CPU 벤더가 아니라 AI 런타임과 GPU-CPU 통합 아키텍처를 가진 플랫폼 사업자로 가져오려 한다는 것으로 풀이된다.

■ Vera Rubin: 데이터센터가 ‘GPU 서버 묶음’에서 ‘AI 팩토리’로 바뀐다

Vera Rubin은 이번 발표의 산업적 무게중심이다.

▲엔비디아가 베라 루빈(Vera Rubin) 플랫폼의 양산을 시작했다(사진 : 엔비디아)

Vera Rubin은 엔비디아의 3세대 MGX 랙스케일 시스템으로, 5개 전용 랙이 하나의 슈퍼컴퓨터처럼 작동하며 이전 세대 Grace Blackwell 대비 에이전트 처리량 10배 향상을 핵심 수치로 내세운다.

Vera Rubin이 과거 Grace Blackwell 세대와 다른 점은 단순한 세대 교체가 아니라 데이터센터 설계 단위의 변화다.

기존에는 GPU 서버, 네트워크, 스토리지, CPU 서버가 데이터센터 안에서 별도 계층으로 설계되는 경우가 많았다.

Vera Rubin은 이를 랙스케일 단위로 통합하고, Spectrum-X 이더넷 포토닉스, BlueField-4 STX, Vera CPU를 결합해 AI 에이전트 시대의 추론 처리량과 전력 효율을 목표로 한다.

이는 데이터센터 사업자의 경제성 계산을 바꾼다.

AI 모델이 단순 질의응답을 넘어 에이전트형 워크플로우로 바뀌면, 하나의 요청이 수많은 추론, 검색, 코드 실행, 도구 호출, 검증 과정을 동반한다.

이때 병목은 GPU 연산뿐 아니라 CPU 오케스트레이션, 네트워크 지연, 스토리지 접근 보안, 랙 단위 전력 효율로 확장된다.

Vera Rubin은 이 병목을 하나의 시스템 설계 문제로 다룬다는 점에서 과거 발표보다 한 단계 더 수직 통합적이다.

■ Vera CPU: 엔비디아의 x86 탈종속 선언

Vera CPU는 이번 발표에서 가장 정치적인 의미를 가진 제품이다.

▲엔비디아가 AI 에이전트 구동을 위한 ‘베라 CPU’를 출시했다.(사진 : 엔비디아)

Vera CPU는 x86이 아닌 Arm 기반 서버 CPU이며, AI 에이전트 워크로드에 특화해 설계됐고 x86 대비 1.8배 빠른 작업 완료 속도를 목표로 한다.

또한 88개 Olympus 코어, 공간적 멀티스레딩, 최대 1.2TB/s 대역폭 LPDDR5X 메모리 서브시스템을 탑재했다.

과거에는 엔비디아가 GPU를 중심으로 데이터센터를 장악하되 CPU는 Intel, AMD, Arm 서버 생태계와 공존하는 구조였다.

반면에 Vera CPU는 에이전트 AI의 병목을 CPU가 직접 해결해야 한다는 논리를 내세운다.

젠슨 황의 발표에 따르면 에이전트 AI가 추론, 검색, 도구 활용, 응답 생성의 수천 단계 과정을 거치면서 CPU가 병목이 된다며, Vera CPU가 파이썬 런타임, 샌드박스 코드 실행, 오케스트레이션 로직, 분석 파이프라인 등 CPU 집약적 작업에 최적화됐다고 언급했다.

이 지점이 Intel과 AMD에는 구조적 위협이다.

엔비디아가 GPU를 넘어 CPU까지 통합하면, AI 데이터센터의 핵심 구매 단위가 ‘범용 서버 + GPU 가속기’에서 ‘엔비디아가 설계한 AI 팩토리 랙’으로 이동할 수 있다.

발표를 분석하면 Intel이 x86 대비 1.8배 성능을 표방하는 Vera CPU로 인해 서버 CPU 시장에서 실질적 도전을 받을 수 있으며, AMD는 Vera Rubin과 CUDA 생태계 심화로 AI 가속기 시장 추격이 더 어려워질 수도 있는 가능성이 있다.

■ Drive Hyperion과 Alpamayo 2: 자율주행은 다시 플랫폼 전쟁

Drive Hyperion 발표는 엔비디아가 로보택시 시장에서 단순 차량용 칩 공급자를 넘어 통합 자율주행 플랫폼 사업자로 움직이고 있음을 보여준다.

▲엔비디아가 드라이브 하이페리온 기반 로보택시 시대 가속화를 선언했다.(사진 : 엔비디아)

발표에 따르면 폭스콘이 대만 가오슝에서 시작해 아시아 전역으로 2028년 로보택시 서비스를 추진하고, VinFast와 AutoBrains가 동남아시아에서 레벨 4 자율주행차 시장 출시를 준비하며, Uber와 AutoBrains가 독일 뮌헨에서 로보택시 프로그램을 본격화하고, HUMAIN이 사우디아라비아와 중동 전역에서 레벨 4 자율주행 교통 도입을 추진한다.

Alpamayo 2 Super는 이 전략의 모델 레이어다.

Alpamayo 2 Super는 320억 파라미터의 오픈 추론 VLA 모델이며, AlpaGym, OmniDreams, Omniverse NuRec과 함께 자율주행차 개발 파이프라인을 제공한다.

과거 자율주행 경쟁이 센서 구성, 주행 데이터, 차량용 칩 성능, 지도 데이터 중심이었다면, 이번 발표는 자율주행을 ‘피지컬 AI + 생성형 월드 모델 + 로보택시 운영 플랫폼’으로 재구성한다.

Cosmos 3가 물리 세계를 예측하고, Alpamayo 2가 자율주행 VLA 모델 역할을 하며, Drive Hyperion이 차량 플랫폼을 제공한다면, 엔비디아는 자율주행 개발사와 완성차·모빌리티 기업에 모델, 시뮬레이션, 차량 컴퓨팅, 운영 생태계를 함께 제공하는 셈이다.

■ DSX: AI 데이터센터를 ‘건설 프로젝트’에서 ‘시뮬레이션 가능한 제품’으로

DSX는 이번 발표에서 상대적으로 덜 주목받을 수 있지만, 장기적으로는 AI 인프라 시장의 구매 방식을 바꿀 수 있는 기술이다.

▲AI 팩토리 인프라 구축 기업에 종합적인 청사진을 제공하는 엔비디아 DSX™ 플랫폼(사진 : 엔비디아)

DSX는 AI 팩토리의 설계, 배포, 운영 전 과정을 지원하는 모듈형 오픈소스 소프트웨어와 레퍼런스 설계 통합 플랫폼이다.

DSX의 핵심 구성으로 DSX MaxLPS, DSX OS, DSX Sim, DSX Flex, DSX Exchange가 있다.

DSX MaxLPS는 동일 전력에서 메가와트당 토큰 처리 성능 40% 향상을 목표로 하고, DSX Sim은 AI 팩토리 전체 수명 주기를 고충실도로 시뮬레이션하며, DSX Flex는 AI 팩토리와 전력망 및 재생에너지 통합을 관리하고, DSX Exchange는 IT·OT·운영 에이전트 간 신호를 통합한다.

과거 데이터센터 구축은 서버 조달, 네트워크 구성, 냉각, 전력, 소프트웨어 스택을 별도로 설계하는 대형 SI 프로젝트에 가까웠다. DSX가 제시하는 방향은 AI 팩토리를 사전에 시뮬레이션하고, 전력망과 운영 신호까지 소프트웨어적으로 관리하는 것이다. 이는 엔비디아가 AI 인프라를 단순 장비 판매가 아니라 설계·운영 체계로 상품화하려 한다는 의미다.

■ TSMC 팹 AI 도입: AI 칩을 만드는 공정 자체가 AI화 된다

이번 발표에서 TSMC 팹 AI 도입은 반도체 산업 관점에서 매우 중요한 의미를 갖는다.

▲TSMC가 엔비디아 가속 컴퓨팅과 AI를 활용해 반도체 설계와 제조를 고도화하고 있다.(사진 : 엔비디아)

TSMC는 엔비디아 CUDA-X 라이브러리를 반도체 설계·제조 전 과정에 적용 중이며, cuLitho, cuEST, cuML, Metropolis와 TAO Toolkit 기반 결함 검사 등을 활용한다.

cuLitho가 CPU 기반 대비 비용 효율 또는 처리 시간을 20∼50% 개선하고, cuEST가 평균 50배 빠른 전자 구조 시뮬레이션을 제공하며, cuML이 수천 개 공정 단계와 수십만 개 매개변수를 머신러닝으로 정제하고, 비전 AI 기반 결함 검사가 나노미터 단위 결함 탐지를 개선한다. 또한 TSMC가 엔비디아 Omniverse를 활용한 가상 팹 환경 FabTwin 구축을 검토 중이다.

이것은 ‘AI가 AI 칩을 만든다’는 순환 구조의 출현이다.

엔비디아의 GPU와 CUDA-X가 TSMC의 공정 효율을 높이고, TSMC는 다시 엔비디아의 차세대 AI 칩 생산을 담당한다.

이 구조가 강화될수록 첨단 반도체 제조는 설계·시뮬레이션·공정 제어·검사·가상 팹 운영까지 AI 소프트웨어와 더 강하게 결합된다.

■ Vera BlueField-4 STX와 OpenShell: 에이전트 시대의 핵심은 ‘권한과 격리’

AI 에이전트가 실제 업무를 수행하려면 보안 문제가 필연적으로 커진다.

▲엔비디아가 ‘베라 블루필드-4 STX’로 보안 내재형 인프라 혁신을 가속화한다.(사진 : 엔비디아)

사용자의 파일을 읽고, 애플리케이션을 실행하고, 네트워크에 접근하고, 장시간 목표를 수행하는 에이전트는 기존 챗봇보다 훨씬 큰 권한을 요구한다.

이 때문에 엔비디아가 OpenShell과 Vera BlueField-4 STX를 함께 제시한 것은 우연이 아니다.

Vera BlueField-4 STX는 기존 에이전트 없는 런타임 대비 최대 1,000배 빠른 런타임 위협 탐지를 제공하며, 최대 800Gb/s 속도로 네트워크·파일 접근 정책을 실행한다.

OpenShell은 자율 에이전트를 위한 오픈소스 보안 런타임으로, 각 에이전트에 개별 격리 샌드박스를 생성한다.

엔비디아 공식 발표에 따르면 OpenShell 런타임을 활용한 Build-a-Claw 경험을 예로 들며, 장시간 실행되는 에이전트가 기업 자동화, 에이전틱 커머스, 자율 인프라의 엔진이 될 수 있지만 안전한 런타임이 필요하다고 설명했다.

또한 OpenShell이 에이전트 워크로드를 격리하고 정책을 적용하며 자율 실행을 신뢰 가능한 경계 안에 유지한다고 설명했다.

이 지점에서 엔비디아의 전략은 명확하다.

에이전트 AI가 보편화되려면 ‘모델 성능’만으로는 부족하다.

권한 관리, 샌드박싱, 정책 집행, 데이터 접근 통제, 런타임 위협 탐지가 함께 필요하다.

OpenShell과 BlueField-4 STX는 엔비디아가 에이전트 시대의 보안 인프라까지 자사 스택 안으로 끌어들이려는 시도로 볼 수 있다.

#엔비디아 #AI 팩토리 #자율주행 #AI 인프라 #GTC 타이페이 #Cosmos 3 #RTX Spark #Vera Rubin #Vera CPU #TSMC 팹 AI