Amazon Trainium3
Amazon Trainium3는 AWS가 자체 설계한 3세대 AI 훈련용 커스텀 칩이다. 이전 세대 대비 4배의 성능 향상과 40%의 에너지 효율 개선을 달성했다.
주요 사양
- 메모리: 128GB HBM3e
- UltraServer 구성: 144칩
- 성능 향상: 이전 세대 대비 4배
- 에너지 효율: 40% 개선
특징
Trainium3는 AWS의 AI 인프라 자립 전략의 핵심 요소이다. 128GB HBM3e 메모리를 탑재하여 대규모 모델 훈련에 필요한 메모리 용량을 확보했다. UltraServer 구성에서 144개의 칩을 연결하여 대규모 분산 훈련을 지원한다.
이전 세대인 Trainium2 대비 4배의 성능 향상을 이루었으며, 동시에 에너지 효율도 40% 개선되었다. 이는 데이터센터 운영 비용과 탄소 배출 절감에 기여한다. AWS의 SageMaker 및 Bedrock 서비스와 긴밀하게 통합되어 있어, AWS 생태계 내에서 NVIDIA H100 등 NVIDIA GPU 대비 비용 효율적인 AI 훈련 환경을 제공하는 것이 목표이다.