Lộ trình AI Agents 2025

[Đang cập nhật]

Kiến thức tiên quyết

Kiến thức nền tảng về LLM

AI Agents 101

Các trường hợp sử dụng mẫu

  • Trợ lý cá nhân
  • Tạo mã nguồn
  • Phân tích dữ liệu
  • Web Scraping / Crawling
  • NPC / AI trong trò chơi

Kỹ thuật Nhắc lệnh (Prompt Engineering)

  • Kiến thức cơ bản về Kỹ thuật Nhắc lệnh
    • Càng cụ thể càng tốt
    • Cung cấp ngữ cảnh
    • Sử dụng thuật ngữ kỹ thuật
    • Bao gồm ví dụ
    • Lặp lại và kiểm tra
    • Chỉ định định dạng đầu ra
  • Lộ trình Kỹ thuật Nhắc lệnh

Công cụ & Hành động (Tools & Actions)

  • Định nghĩa Công cụ (Tool Definition)
    • Tên và Mô tả
    • Schema Đầu vào / Đầu ra (Input / Output Schema)
    • Xử lý lỗi (Error Handling)
    • Ví dụ sử dụng (Usage Examples)
  • Ví dụ về Công cụ
    • Tìm kiếm Web
    • Thực thi mã nguồn / REPL
    • Truy vấn cơ sở dữ liệu
    • Yêu cầu API
    • Email / Slack / SMS
    • Truy cập hệ thống tệp

Bộ nhớ Agent (Agent Memory)

  • Bộ nhớ Agent là gì?
    • Bộ nhớ ngắn hạn / dài hạn (Short Term / Long Term Memory)
    • Trong nhắc lệnh (Within Prompt)
    • Vector DB / SQL / Tùy chỉnh (Vector DB / SQL / Custom)
    • Bộ nhớ theo sự kiện (Episodic) so với ngữ nghĩa (Semantic Memory)
  • Quản lý bộ nhớ (Memory Management)
    • Lưu trữ hồ sơ người dùng (User Profile Storage)
    • Tóm tắt & Nén (Summarization & Compression)
    • Chiến lược quên / lão hóa (Forgetting / Aging Strategies)

Các Kiến trúc Agent (Agent Architectures)

  • ReAct (Reason + Act)
  • Giao thức Ngữ cảnh Mô hình (Model Context Protocol – MCP)
    • MCP Hosts / Clients / Servers
  • Chuỗi suy nghĩ (Chain of Thought – CoT)
  • Agent RAG (RAG Agents)
  • Lập kế hoạch-Thực thi (Planner-Executor)
  • Agent DAG (DAG Agents)
  • Cây suy nghĩ (Tree-of-Thought)

Xây dựng Agent (Building Agents)

  • Phát triển thủ công (Manual Development)
    • Gọi API LLM trực tiếp (Direct LLM API Calls)
    • Triển khai vòng lặp Agent (Implement Agent Loop)
    • Phân tích đầu ra mô hình (Parse Model Output)
    • Xử lý lỗi & Giới hạn tốc độ (Handle Errors & Rate Limits)
  • Gọi hàm gốc của LLM (LLM-native Function Calling)
    • OpenAI Functions
    • Gemini Function Calling
    • OpenAI Assistant API
  • Các Framework cho Agent (Frameworks for Agents)
    • LangChain
    • LlamaIndex
    • Haystack
    • AutoGen
    • CrewAI
    • Smol Depot
    • Anthropic Tool Use

Đánh giá & Kiểm thử (Evaluation & Testing)

  • Các chỉ số và Kiểm thử (Metrics and Testing)
    • Unit Tests (Công cụ)
    • Integration Testing (Luồng)
    • Đánh giá có sự tham gia của con người (Human-in-the-Loop Evaluation)
  • Các Công cụ (Tools)
    • LangSmith
    • Ragas
    • DeepEval

Khả năng Quan sát & Giám sát (Observability & Monitoring)

  • Ghi nhật ký và Theo dõi có cấu trúc (Structured Logging and Tracing)
  • Gỡ lỗi và Giám sát (Debugging and Monitoring)
  • Các Công cụ Quan sát (Observability Tools)
    • LangSmith
    • Helicone
    • LangFuse
    • OpenLLMetry

Bảo mật & Đạo đức (Security & Ethics)

  • Tấn công tiêm nhắc lệnh (Prompt Injection) / Vượt rào (Jailbreaks)
  • Sandboxing và Cấp quyền cho công cụ (Tool Sandboxing and Permissioning)
  • Quyền riêng tư dữ liệu và che dấu PII (Data Privacy and PII Redaction)
  • Rào chắn chống thiên vị và độc hại (Bias and Toxicity Guardrails)
  • Kiểm thử An toàn và Red Team (Safety and Red Team Testing)
Chỉ mục