Google TPU v7 Ironwood

🏷️ 벤치마크 AI평가 TPU

Google TPU v7 Ironwood는 Google이 자체 설계한 7세대 텐서 처리 유닛(TPU)으로, 2025년 11월에 출시되었다. 추론 워크로드에 최적화된 설계가 특징이다.

주요 사양

특징

Ironwood는 이전 세대들과 달리 추론 성능에 초점을 맞춘 설계를 채택했다. 풀 클러스터 구성 시 42.5 exaflops라는 압도적인 연산 성능을 달성하며, 이는 Google의 대규모 AI 서비스(검색, Gemini 등)를 뒷받침하는 핵심 인프라이다.

Google Cloud를 통해 외부 고객에게도 제공되며, JAX 및 TensorFlow 프레임워크와 긴밀하게 통합되어 있다. 자체 설계 칩이라는 특성상 Google의 소프트웨어 스택과의 최적화 수준이 높으며, 대규모 모델 서빙에서 뛰어난 전력 효율과 비용 효율을 제공한다.