# Google Gemini 2.5 Flash: Cải tiến chỉnh sửa ảnh AI

Google vừa công bố mô hình “nano banana” (tên chính thức là Gemini 2.5 Flash Image) – một đột phá trong công nghệ chỉnh sửa ảnh AI, đang dẫn đầu bảng xếp hạng LMArena về khả năng xử lý hình ảnh.

Gemini 2.5 Flash Image đang đứng đầu bảng xếp hạng chỉnh sửa ảnh của LMArena.

Trong thế giới chỉnh sửa ảnh AI gần đây đã diễn ra một sự kiện đáng chú ý. Một mô hình mới được biết đến với tên gọi “nano banana” đã xuất hiện với những khả năng ấn tượng, giúp nó nhanh chóng leo lên vị trí số một trên bảng xếp hạng LMArena. Hiện tại, Google đã chính thức xác nhận rằng nano banana chính là một sản phẩm từ Google DeepMind, và tính năng này đang được triển khai ứng dụng cho ứng dụng Gemini từ hôm nay.

Chỉnh sửa ảnh AI cho phép người dùng thay đổi hình ảnh bằng cách sử dụng câu lệnh thay vì phải thao tác thủ công trong các phần mềm như Photoshop. Google lần đầu tiên cung cấp khả năng chỉnh sửa trong Gemini vào đầu năm nay, và mô hình đó đã tỏ ra khá ấn tượng ngay từ những ngày đầu. Tuy nhiên, giống như tất cả các hệ sinh tạo, bản chất không xác định có nghĩa là các yếu tố trong hình ảnh thường thay đổi theo những cách không thể dự đoán. Google cho biết mô hình nano banana (chính xác là Gemini 2.5 Flash Image) có khả năng nhất quán vượt trội qua các lần chỉnh sửa – nó có thể ghi nhớ chi tiết thay vì phải “may rủi” mỗi khi bạn thực hiện một thay đổi.

Google cho biết đối tượng sẽ giữ được diện mạo của họ khi bạn chỉnh sửa.

Sự phát triển này mở ra nhiều ứng dụng thú vị cho công nghệ chỉnh sửa ảnh AI. Google gợi ý rằng người dùng có thể tải lên ảnh chân dung của một người và thay đổi phong cách hoặc trang phục của họ. Ví dụ, bạn có thể tưởng tượng lại ai đó với tư cách là một matador hoặc một nhân vật trong sitcom thập niên 90. Vì mô hình nano banana có thể duy trì tính nhất quán qua các lần chỉnh sửa, kết quả vẫn sẽ trông giống như người trong ảnh nguồn gốc. Điều này cũng đúng khi bạn thực hiện nhiều lần chỉnh sửa liên tiếp. Google cam kết rằng ngay cả sau nhiều lần chỉnh sửa, kết quả vẫn giữ được diện mạo giống với nguyên bản.

Con chó đáng yêu nhất.

Chỉnh sửa ảnh được nâng cấp của Gemini cũng có thể hợp nhất nhiều hình ảnh, cho phép bạn sử dụng chúng làm nguồn để tạo ra một hình ảnh mới theo ý muốn. Ví dụ của Google dưới đây lấy các hình ảnh riêng biệt của một người phụ nữ và một con chó, sau đó sử dụng chúng để tạo ra một bức ảnh mới về việc con chó đang được ôm ấp – có thể là ứng dụng tuyệt vời nhất của trí tuệ sinh tạo cho đến nay. Chỉnh sửa ảnh Gemini cũng có thể kết hợp các yếu tố theo những cách trừu tượng hơn và sẽ tuân theo các chỉ dẫn của bạn để tạo ra gần như bất cứ điều gì không vi phạm các rào cản của mô hình.

Mô hình ghi nhớ chi tiết thay vì tạo ra hoàn toàn những thứ mới mỗi khi.

Giống như các mô hình tạo ảnh AI khác của Google, đầu ra của Gemini 2.5 Flash Image luôn có dấu water “AI” hiển thị ở góc. Hình ảnh cũng có chứa một dấu water kỹ thuật số SynthID không thể nhìn thấy có thể được phát hiện ngay cả sau khi có sự điều chỉnh ở mức độ vừa phải.

Bạn có thể thử tính năng chỉnh sửa ảnh gốc mới này ngay hôm nay trong ứng dụng Gemini. Google cho biết mô hình hình ảnh mới cũng sẽ sớm được triển khai trong API Gemini, AI Studio, và Vertex AI dành cho nhà phát triển.

Sự phát triển này cho thấy Google đang không ngừng cải tiến công nghệ AI của mình, mang đến cho người dùng những công cụ chỉnh sửa ảnh mạnh mẽ, dễ sử dụng hơn mà vẫn giữ được tính nhất quán cao qua các lần chỉnh sửa. Với Gemini 2.5 Flash, việc chỉnh sửa ảnh bằng AI đã trở nên đáng tin cậy và sáng tạo hơn bao giờ hết.