Trong khi OpenAI gây chú ý với công bố vào thứ Bảy, đội ngũ Google Gemini cũng đạt thành tích ấn tượng không kém tại kỳ thi Olympic Toán học Quốc tế (IMO) năm nay. Mô hình nghiên cứu đặc biệt của họ đã xuất sắc giành huy chương vàng với điểm số hoàn hảo.
Mục lục
Kết quả ấn tượng từ hai gã khổng lồ AI
Điểm đáng chú ý là cả Gemini và OpenAI đều đạt cùng điểm số 35/42 – giải quyết thành công 5 bài toán đầu tiên và chỉ gặp khó khăn ở câu hỏi số 6 – bài toán khó nhất.
Mỗi bài toán trong IMO có giá trị 7 điểm. Thành tích 35 điểm đồng nghĩa với việc trả lời chính xác 5/6 bài. Trong số 630 thí sinh năm nay, chỉ 6 người đạt điểm tối đa cho câu 6, và 55 thí sinh khác có điểm số lớn hơn 0.
Công nghệ đột phá phía sau thành công
Khác với tuyên bố của OpenAI về việc chưa tối ưu mô hình cho IMO, đội Google Gemini đã sử dụng phiên bản nâng cao mang tên Deep Think – chế độ lý luận nâng cao cho các vấn đề phức tạp.
- Tích hợp kỹ thuật nghiên cứu mới nhất, bao gồm tư duy song song
- Cho phép mô hình khám phá và kết hợp đồng thời nhiều giải pháp tiềm năng
- Huấn luyện bổ sung với kỹ thuật học tăng cường mới
- Bổ sung kho dữ liệu giải pháp toán học chất lượng cao
Đặc biệt, Gemini hoàn thành bài thi mà không sử dụng công cụ hỗ trợ hay truy cập internet, tương tự cách tiếp cận của OpenAI.
So sánh với thành tích năm trước
Năm 2024, Google DeepMind đạt huy chương bạc với mô hình AlphaProof và AlphaGeometry 2, giải quyết 4/6 bài toán. Các vấn đề khi đó cần được dịch thủ công sang ngôn ngữ toán học chính thức, thời gian giải quyết dao động từ vài phút đến ba ngày.
Thành tích năm nay của Gemini càng ấn tượng hơn khi đạt huy chương vàng với một mô hình duy nhất, trong thời gian quy định và không cần bước dịch thủ công.
Thời điểm công bố kết quả
Demis Hassabis, CEO DeepMind, giải thích về thời điểm công bố: “Chúng tôi tôn trọng yêu cầu của Ban tổ chức IMO rằng tất cả phòng thí nghiệm AI sẽ chia sẻ kết quả sau khi được xác minh bởi chuyên gia độc lập.”
Phía OpenAI cũng cho biết họ đã trao đổi với thành viên ban tổ chức IMO và đồng ý đợi đến sau lễ trao giải mới công bố kết quả.
Điểm khác biệt là đội Gemini tham gia chính thức trong khi OpenAI không tham gia hình thức này. Cả hai đều không sử dụng Lean trong quá trình dự thi – công cụ này sẽ bị tính là hỗ trợ bên ngoài.
Tài liệu tham khảo
Những ai quan tâm có thể so sánh lời giải của Gemini trong tài liệu PDF chính thức với lời giải của OpenAI trên GitHub. Đây là cơ hội tuyệt vời để thấy rõ sự tiến bộ vượt bậc của AI trong lĩnh vực toán học thuần túy.



