Ironwood TPU: Bước Đột Phá Của Google Trong Thời Đại AI Suy Luận

Google vừa công bố Ironwood, thế hệ thứ 7 của Tensor Processing Unit (TPU), tại sự kiện Google Cloud Next 25. Đây là bộ xử lý AI tùy chỉnh mạnh mẽ nhất từ trước đến nay của hãng, được thiết kế đặc biệt cho tác vụ suy luận (inference) trong các mô hình AI.

Công Nghệ Đột Phá Đón Đầu Kỷ Nguyên AI Suy Luận

Ironwood đánh dấu bước chuyển quan trọng trong phát triển cơ sở hạ tầng AI. Khác với các mô hình AI phản hồi thông thường, Ironwood được tối ưu hóa cho “thời đại suy luận” – nơi AI có khả năng chủ động phân tích, diễn giải dữ liệu và đưa ra insights thay vì chỉ cung cấp thông tin.

Với khả năng mở rộng lên đến 9.216 chip được làm mát bằng chất lỏng, Ironwood mang lại hiệu suất tính toán 42,5 Exaflops – gấp 24 lần siêu máy tính mạnh nhất thế giới hiện nay (El Capitan). Mỗi chip đơn lẻ đạt hiệu suất đỉnh 4.614 TFLOPs.

Kiến Trúc Thiết Kế Ưu Việt

Ironwood TPU sở hữu nhiều cải tiến đáng chú ý:

  • Bộ nhớ HBM 192GB/chip, tăng 6 lần so với thế hệ trước
  • Băng thông bộ nhớ 7,2 TBps/chip, tăng 4,5 lần
  • Kết nối liên chip 1,2 Tbps hai chiều
  • Cải tiến SparseCore cho xử lý embedding quy mô lớn

Hiệu Suất Vượt Trội

Ironwood không chỉ mạnh mẽ mà còn cực kỳ tiết kiệm năng lượng:

  • Hiệu suất năng lượng gấp 2 lần thế hệ Trillium TPU
  • Tiết kiệm điện năng gấp 30 lần so với TPU đám mây đầu tiên
  • Hệ thống làm mát bằng chất lỏng duy trì hiệu suất ổn định

Công nghệ này đang được sử dụng để vận hành các mô hình AI tiên tiến như Gemini 2.5 và AlphaFold – giải thưởng Nobel. Ironwood dự kiến sẽ có mặt cho khách hàng Google Cloud trong năm nay.

Chỉ mục