DolphinGemma: Google AI Giúp Giải Mã Ngôn Ngữ Của Cá Heo

DolphinGemma, một mô hình ngôn ngữ lớn do Google phát triển, đang giúp các nhà khoa học nghiên cứu cách cá heo giao tiếp — và hy vọng sẽ hiểu được chúng đang nói gì.

Mở Rộng Hiểu Biết Về Thế Giới Của Cá Heo

Trong nhiều thập kỷ, việc hiểu được những tiếng kêu, tiếng huýt sáo và xung động của cá heo đã là một thách thức khoa học. Nhưng điều gì sẽ xảy ra nếu chúng ta không chỉ lắng nghe mà còn có thể hiểu được các mẫu giao tiếp phức tạp của chúng, đủ để tạo ra các phản hồi thực tế?

Nhân Ngày Cá Heo Quốc Gia, Google, kết hợp với các nhà nghiên cứu tại Georgia Tech và Dự án Cá Heo Hoang Dã (WDP), đã công bố tiến bộ đáng kể của DolphinGemma: một mô hình AI cơ bản được huấn luyện để học cấu trúc âm thanh của cá heo và tạo ra các chuỗi âm thanh mới giống như của chúng. Nỗ lực này không chỉ mở rộng ranh giới của AI mà còn kết nối chúng ta sâu sắc hơn với thế giới đại dương.

DolphinGemma: Bước Đột Phá Trong Nghiên Cứu Âm Thanh Cá Heo

DolphinGemma được phát triển bởi Google, sử dụng công nghệ âm thanh đặc biệt: SoundStream tokenizer giúp biểu diễn hiệu quả âm thanh của cá heo, sau đó được xử lý bởi một kiến trúc mô hình phù hợp với các chuỗi phức tạp. Mô hình này, với khoảng 400 triệu tham số, được thiết kế để chạy trực tiếp trên điện thoại Pixel mà WDP sử dụng trong thực địa.

DolphinGemma được xây dựng dựa trên nền tảng của Gemma, bộ sưu tập các mô hình nhẹ và tiên tiến của Google. Được huấn luyện kỹ lưỡng trên cơ sở dữ liệu âm thanh của cá heo đốm Đại Tây Dương, DolphinGemma hoạt động như một mô hình âm thanh vào-âm thanh ra, xử lý các chuỗi âm thanh tự nhiên để xác định mẫu, cấu trúc và dự đoán các âm thanh tiếp theo trong chuỗi, tương tự như cách các mô hình ngôn ngữ lớn dự đoán từ tiếp theo trong câu.

Ứng Dụng CHAT: Giao Tiếp Hai Chiều Với Cá Heo

Ngoài việc phân tích giao tiếp tự nhiên, WDP cũng đang theo đuổi một hướng nghiên cứu song song: khám phá khả năng tương tác hai chiều bằng công nghệ dưới nước. Điều này dẫn đến sự phát triển của hệ thống CHAT (Cetacean Hearing Augmentation Telemetry), hợp tác với Viện Công nghệ Georgia.

CHAT là một máy tính dưới nước được thiết kế để thiết lập một từ vựng đơn giản, chung với cá heo. Bằng cách liên kết các tiếng huýt sáo mới với các vật thể mà cá heo yêu thích, như rong biển hoặc khăn choàng, các nhà nghiên cứu hy vọng cá heo sẽ học cách bắt chước những tiếng huýt này để yêu cầu các vật thể đó.

Tiềm Năng Của DolphinGemma Trong Nghiên Cứu Tương Lai

Google đang có kế hoạch chia sẻ DolphinGemma như một mô hình mở vào mùa hè này. Dù được huấn luyện trên âm thanh của cá heo đốm Đại Tây Dương, mô hình này có tiềm năng ứng dụng cho các nhà nghiên cứu đang nghiên cứu các loài cá heo khác, như cá heo mũi chai hoặc cá heo xoáy.

Bằng cách cung cấp các công cụ như DolphinGemma, Google hy vọng sẽ trao quyền cho các nhà nghiên cứu trên toàn thế giới, giúp họ khai thác dữ liệu âm thanh của riêng mình, tăng tốc quá trình tìm kiếm các mẫu và cùng nhau làm sâu sắc thêm hiểu biết của chúng ta về những loài động vật biển thông minh này.

Hành trình hiểu được ngôn ngữ của cá heo còn dài, nhưng sự kết hợp giữa nghiên cứu thực địa của WDP, chuyên môn kỹ thuật từ Georgia Tech và sức mạnh công nghệ của Google đang mở ra những khả năng mới đầy thú vị. Chúng ta không chỉ đang lắng nghe, mà còn đang bắt đầu hiểu được những mẫu âm thanh, từ đó tiến gần hơn đến một tương lai mà khoảng cách giữa giao tiếp của con người và cá heo có thể được thu hẹp.

Chỉ mục