Google vừa công bố Ironwood, thế hệ thứ 7 của Tensor Processing Unit (TPU), tại sự kiện Google Cloud Next 25. Đây là bộ xử lý AI tùy chỉnh mạnh mẽ nhất từ trước đến nay của hãng, được thiết kế đặc biệt cho tác vụ suy luận (inference) trong các mô hình AI.
Mục lục
Công Nghệ Đột Phá Đón Đầu Kỷ Nguyên AI Suy Luận
Ironwood đánh dấu bước chuyển quan trọng trong phát triển cơ sở hạ tầng AI. Khác với các mô hình AI phản hồi thông thường, Ironwood được tối ưu hóa cho “thời đại suy luận” – nơi AI có khả năng chủ động phân tích, diễn giải dữ liệu và đưa ra insights thay vì chỉ cung cấp thông tin.
Với khả năng mở rộng lên đến 9.216 chip được làm mát bằng chất lỏng, Ironwood mang lại hiệu suất tính toán 42,5 Exaflops – gấp 24 lần siêu máy tính mạnh nhất thế giới hiện nay (El Capitan). Mỗi chip đơn lẻ đạt hiệu suất đỉnh 4.614 TFLOPs.
Kiến Trúc Thiết Kế Ưu Việt
Ironwood TPU sở hữu nhiều cải tiến đáng chú ý:
- Bộ nhớ HBM 192GB/chip, tăng 6 lần so với thế hệ trước
- Băng thông bộ nhớ 7,2 TBps/chip, tăng 4,5 lần
- Kết nối liên chip 1,2 Tbps hai chiều
- Cải tiến SparseCore cho xử lý embedding quy mô lớn
Hiệu Suất Vượt Trội
Ironwood không chỉ mạnh mẽ mà còn cực kỳ tiết kiệm năng lượng:
- Hiệu suất năng lượng gấp 2 lần thế hệ Trillium TPU
- Tiết kiệm điện năng gấp 30 lần so với TPU đám mây đầu tiên
- Hệ thống làm mát bằng chất lỏng duy trì hiệu suất ổn định
Công nghệ này đang được sử dụng để vận hành các mô hình AI tiên tiến như Gemini 2.5 và AlphaFold – giải thưởng Nobel. Ironwood dự kiến sẽ có mặt cho khách hàng Google Cloud trong năm nay.