[Đang cập nhật]
Mục lục
Kiến thức tiên quyết
- Phát triển Backend cơ bản
- Sử dụng Git và Terminal
- Kiến thức về REST API
- Thiết kế API
- Git và GitHub
Kiến thức nền tảng về LLM
- Mô hình Transformer và LLM
- Token hóa (Tokenization)
- Cửa sổ ngữ cảnh (Context Windows)
- Định giá dựa trên Token (Token-Based Pricing)
- Kiểm soát tạo văn bản (Generation Controls)
- Nhiệt độ (Temperature)
- Phạt tần suất (Frequency Penalty)
- Phạt hiện diện (Presence Penalty)
- Top-p
- Tiêu chí dừng (Stopping Criteria)
- Các loại mô hình (Model Types)
- Mô hình mã nguồn mở (Open Weight) so với mã nguồn đóng (Closed Weight)
- Các dòng mô hình và giấy phép (Model Families and Licenses)
- Phản hồi theo luồng (Streamed) so với không theo luồng (Unstreamed Responses)
- Mô hình suy luận (Reasoning) so với mô hình chuẩn (Standard Models)
- Tinh chỉnh (Fine-tuning) so với Kỹ thuật Nhắc lệnh (Prompt Engineering)
- Embeddings và Tìm kiếm Vector (Vector Search)
- Kiến thức cơ bản về Sinh văn bản tăng cường truy xuất (Retrieval-Augmented Generation – RAG)
- Tổng quan về định giá mô hình (Model Pricing Overview)
AI Agents 101
- AI Agents là gì?
- Công cụ (Tools) là gì?
- Vòng lặp Agent (Agent Loop)
- Tiếp nhận / Đầu vào người dùng (Perception / User Input)
- Suy luận và Lập kế hoạch (Reason and Plan)
- Hành động / Gọi công cụ (Acting / Tool Invocation)
- Quan sát & Phản hồi (Observation & Reflection)
Các trường hợp sử dụng mẫu
- Trợ lý cá nhân
- Tạo mã nguồn
- Phân tích dữ liệu
- Web Scraping / Crawling
- NPC / AI trong trò chơi
Kỹ thuật Nhắc lệnh (Prompt Engineering)
- Kiến thức cơ bản về Kỹ thuật Nhắc lệnh
- Càng cụ thể càng tốt
- Cung cấp ngữ cảnh
- Sử dụng thuật ngữ kỹ thuật
- Bao gồm ví dụ
- Lặp lại và kiểm tra
- Chỉ định định dạng đầu ra
- Lộ trình Kỹ thuật Nhắc lệnh
Công cụ & Hành động (Tools & Actions)
- Định nghĩa Công cụ (Tool Definition)
- Tên và Mô tả
- Schema Đầu vào / Đầu ra (Input / Output Schema)
- Xử lý lỗi (Error Handling)
- Ví dụ sử dụng (Usage Examples)
- Ví dụ về Công cụ
- Tìm kiếm Web
- Thực thi mã nguồn / REPL
- Truy vấn cơ sở dữ liệu
- Yêu cầu API
- Email / Slack / SMS
- Truy cập hệ thống tệp
Bộ nhớ Agent (Agent Memory)
- Bộ nhớ Agent là gì?
- Bộ nhớ ngắn hạn / dài hạn (Short Term / Long Term Memory)
- Trong nhắc lệnh (Within Prompt)
- Vector DB / SQL / Tùy chỉnh (Vector DB / SQL / Custom)
- Bộ nhớ theo sự kiện (Episodic) so với ngữ nghĩa (Semantic Memory)
- Quản lý bộ nhớ (Memory Management)
- Lưu trữ hồ sơ người dùng (User Profile Storage)
- Tóm tắt & Nén (Summarization & Compression)
- Chiến lược quên / lão hóa (Forgetting / Aging Strategies)
Các Kiến trúc Agent (Agent Architectures)
- ReAct (Reason + Act)
- Giao thức Ngữ cảnh Mô hình (Model Context Protocol – MCP)
- MCP Hosts / Clients / Servers
- Chuỗi suy nghĩ (Chain of Thought – CoT)
- Agent RAG (RAG Agents)
- Lập kế hoạch-Thực thi (Planner-Executor)
- Agent DAG (DAG Agents)
- Cây suy nghĩ (Tree-of-Thought)
Xây dựng Agent (Building Agents)
- Phát triển thủ công (Manual Development)
- Gọi API LLM trực tiếp (Direct LLM API Calls)
- Triển khai vòng lặp Agent (Implement Agent Loop)
- Phân tích đầu ra mô hình (Parse Model Output)
- Xử lý lỗi & Giới hạn tốc độ (Handle Errors & Rate Limits)
- Gọi hàm gốc của LLM (LLM-native Function Calling)
- OpenAI Functions
- Gemini Function Calling
- OpenAI Assistant API
- Các Framework cho Agent (Frameworks for Agents)
- LangChain
- LlamaIndex
- Haystack
- AutoGen
- CrewAI
- Smol Depot
- Anthropic Tool Use
Đánh giá & Kiểm thử (Evaluation & Testing)
- Các chỉ số và Kiểm thử (Metrics and Testing)
- Unit Tests (Công cụ)
- Integration Testing (Luồng)
- Đánh giá có sự tham gia của con người (Human-in-the-Loop Evaluation)
- Các Công cụ (Tools)
- LangSmith
- Ragas
- DeepEval
Khả năng Quan sát & Giám sát (Observability & Monitoring)
- Ghi nhật ký và Theo dõi có cấu trúc (Structured Logging and Tracing)
- Gỡ lỗi và Giám sát (Debugging and Monitoring)
- Các Công cụ Quan sát (Observability Tools)
- LangSmith
- Helicone
- LangFuse
- OpenLLMetry
Bảo mật & Đạo đức (Security & Ethics)
- Tấn công tiêm nhắc lệnh (Prompt Injection) / Vượt rào (Jailbreaks)
- Sandboxing và Cấp quyền cho công cụ (Tool Sandboxing and Permissioning)
- Quyền riêng tư dữ liệu và che dấu PII (Data Privacy and PII Redaction)
- Rào chắn chống thiên vị và độc hại (Bias and Toxicity Guardrails)
- Kiểm thử An toàn và Red Team (Safety and Red Team Testing)