Google TPU v7 Ironwood
Google TPU v7 Ironwood는 Google이 자체 설계한 7세대 텐서 처리 유닛(TPU)으로, 2025년 11월에 출시되었다. 추론 워크로드에 최적화된 설계가 특징이다.
주요 사양
- 세대: 7세대 TPU
- 출시 시기: 2025년 11월
- 풀 클러스터 성능: 42.5 exaflops
- 최적화 대상: 추론
특징
Ironwood는 이전 세대들과 달리 추론 성능에 초점을 맞춘 설계를 채택했다. 풀 클러스터 구성 시 42.5 exaflops라는 압도적인 연산 성능을 달성하며, 이는 Google의 대규모 AI 서비스(검색, Gemini 등)를 뒷받침하는 핵심 인프라이다.
Google Cloud를 통해 외부 고객에게도 제공되며, JAX 및 TensorFlow 프레임워크와 긴밀하게 통합되어 있다. 자체 설계 칩이라는 특성상 Google의 소프트웨어 스택과의 최적화 수준이 높으며, 대규모 모델 서빙에서 뛰어난 전력 효율과 비용 효율을 제공한다.