Khóa học mã nguồn mở PhiloAgents mang đến cho bạn cơ hội khám phá cách xây dựng và triển khai các agent AI trong môi trường game, biến các nhân vật NPC thành những nhân vật có tính cách giống con người. Đây là bài học thứ tư trong khóa học gồm 6 module, hứa hẹn đem lại kiến thức thực tiễn và sâu sắc.
Mục lục
Khóa Học PhiloAgents: Hành Trình 6 Module
- Module 1: Xây dựng agent AI cho mô phỏng game
- Module 2: Tạo agent RAG sẵn sàng cho sản xuất
- Module 3: Bí quyết về bộ nhớ trong AI agent
- Module 4: Triển khai agent dưới dạng API thời gian thực
- Module 5: Đánh giá agent và quản lý phiên bản prompt (đang phát triển)
- Module 6: Mô phỏng đa agent trong thực tế (đang phát triển)
🔗 Tìm hiểu thêm về khóa học và cấu trúc nội dung.
Khóa học là sự hợp tác giữa Decoding ML và Miguel Pedrido (từ The Neural Maze).
Giới Thiệu Về Bài Học 4: Triển Khai Agent Dưới Dạng API Thời Gian Thực
Trong bài học này, bạn sẽ học cách kiến trúc và xây dựng một agent mô phỏng game sẵn sàng cho sản xuất, biến các NPC thành những nhân vật tương tác giống con người. Chúng tôi tin rằng cách tốt nhất để học là thực hành. Không lý thuyết suông, không nghiên cứu vô ích, chỉ cần bắt đầu và học hỏi trên hành trình.
Đến thời điểm này, chúng ta đã tập trung vào việc giúp agent “nghĩ”. Tuy nhiên, một nhà triết học tài năng sẽ không thể làm gì nếu bị nhốt trong tầng hầm và không có cách nào để giao tiếp với thế giới. Trong ứng dụng thực tế, trí thông minh là chưa đủ. Nếu muốn agent của mình trở nên hữu ích, chúng cần phải dễ tiếp cận, tương tác và sẵn sàng cho sản xuất.
Bài học này đánh dấu bước ngoặt từ logic bên trong sang giao tiếp bên ngoài. Bạn sẽ học cách đưa agent của mình lên mạng, giúp nó tham gia vào hệ thống thời gian thực và trở thành một thành phần động trong kiến trúc lớn hơn.
Kiến Trúc Backend-Frontend Cho PhiloAgent
Để PhiloAgent hoạt động trong game, chúng ta cần một kiến trúc kết nối nó với người chơi thông qua tương tác thời gian thực. Thiết kế của chúng tôi tập trung vào việc tách biệt giữa backend và frontend, cho phép mỗi phần tập trung vào nhiệm vụ chính của mình.
Backend, được xây dựng bằng FastAPI, xử lý tất cả logic cốt lõi của ứng dụng. Nó chịu trách nhiệm nhận tin nhắn, phân tích và tạo phản hồi thông qua các agent triết gia. Mặt khác, frontend—được phát triển bằng Phaser.js (một framework game JavaScript)—cung cấp lớp tương tác nơi người dùng giao tiếp với các agent trong thời gian thực.
Tại Sao Cần Tách Biệt Backend và Frontend?
Việc tách biệt frontend và backend mang lại sự linh hoạt, dễ bảo trì và khả năng mở rộng. Mỗi phần có thể phát triển độc lập:
- Frontend tập trung vào việc hiển thị game, xử lý đầu vào của người dùng và cung cấp giao diện người dùng phản hồi nhanh.
- Backend chịu trách nhiệm lý luận của agent, quản lý trạng thái và tạo phản hồi (được gọi là logic nghiệp vụ).
Game có thể phát triển mà không cần thay đổi logic agent, và backend có thể được tái sử dụng cho các giao diện khác (như chatbot, ứng dụng di động hoặc thậm chí là mô phỏng VR).
Kết Luận
Trong bài học thứ tư của khóa học PhiloAgents, chúng ta đã chuyển trọng tâm từ thiết kế agent bên trong sang giao tiếp bên ngoài—biến các triết gia cô lập thành những agent hội thoại có thể truy cập và tương tác trên web.
Chúng ta bắt đầu bằng việc xem lại các nguyên tắc cơ bản của web API, cách chúng cho phép tương tác giữa các hệ thống thông qua yêu cầu và phản hồi có cấu trúc. Sau đó, chúng ta xây dựng endpoint RESTful đầu tiên bằng FastAPI và học cách triển khai chúng. Tiếp theo, chúng ta khám phá sức mạnh của WebSockets—thiết lập kết nối hai chiều liên tục để truyền phản hồi từng token một.
Trong bài học tiếp theo (Module 5), chúng ta sẽ khám phá LLMOps, cụ thể là cách đánh giá agent hiệu quả, theo dõi lịch sử prompt và quản lý phiên bản prompt để hỗ trợ phát triển lặp đi lặp lại.
💻 Khám phá tất cả các bài học và mã nguồn trong kho lưu trữ GitHub.
Hợp tác giữa Decoding ML và Miguel Pedrido (từ The Neural Maze).