Chào mừng các bạn quay trở lại với series “AI Agent Roadmap”! Trong những bài viết trước, chúng ta đã cùng nhau khám phá AI Agent là gì, đi sâu vào vòng lặp hoạt động của Agent (Nhận thức, Suy luận, Hành động), tìm hiểu về Transformers và LLM, cũng như ảnh hưởng của Tokenization và Cửa sổ Ngữ cảnh. Chúng ta cũng đã bàn về cách lựa chọn LLM phù hợp và sự khác biệt giữa mô hình trọng số mở và đóng.
Một trong những kỹ năng cốt lõi khi làm việc với các mô hình ngôn ngữ lớn (LLM) và đặc biệt là xây dựng AI Agent chính là Prompt Engineering. Chúng ta đã có một bài giới thiệu về viết prompt hiệu quả cho các tác vụ phức tạp. Tuy nhiên, để làm cho đầu ra của AI trở nên đáng tin cậy, nhất quán và đáp ứng đúng mục tiêu hơn, đặc biệt trong các tác vụ phức tạp của agent, chúng ta cần áp dụng các “mô hình” (patterns) đã được chứng minh là hiệu quả.
Bài viết này sẽ đi sâu vào các mô hình Prompt Engineering phổ biến và cách chúng giúp chúng ta kiểm soát và cải thiện chất lượng đầu ra của LLM, biến chúng thành những công cụ mạnh mẽ hơn trong tay AI Agent của bạn.
Mục lục
Mô Hình Prompt Engineering là Gì và Tại Sao Chúng Quan Trọng?
Prompt Engineering không chỉ đơn giản là “hỏi AI một câu hỏi”. Đó là nghệ thuật và khoa học về việc thiết kế câu lệnh (prompt) sao cho mô hình ngôn ngữ hiểu rõ ý định của chúng ta và tạo ra đầu ra mong muốn. Khi xây dựng AI Agent, agent thường phải tự tạo ra các prompt để thực hiện các bước trong vòng lặp của nó: từ truy xuất thông tin (RAG), phân tích dữ liệu nhận thức được, đến lập kế hoạch các hành động cụ thể.
Mô hình Prompt Engineering là các cấu trúc hoặc kỹ thuật viết prompt lặp đi lặp lại, đã được chứng minh là hiệu quả trong việc đạt được các loại đầu ra cụ thể từ LLM. Thay vì chỉ thử nghiệm ngẫu nhiên, việc áp dụng các mô hình giúp chúng ta:
- Tăng tính nhất quán: Giúp LLM hiểu và thực hiện cùng một loại tác vụ theo cách tương tự mỗi lần.
- Cải thiện độ tin cậy: Giảm thiểu các phản hồi không liên quan, sai lệch hoặc “ảo giác”.
- Giải quyết các tác vụ phức tạp: Chia nhỏ vấn đề hoặc hướng dẫn LLM thực hiện các bước suy luận logic.
- Tăng hiệu quả: Đạt được kết quả mong muốn nhanh hơn với ít lần lặp lại hơn.
- Dễ dàng quản lý và tái sử dụng: Các mô hình có thể được đóng gói và sử dụng lại cho các tác vụ hoặc agent khác nhau.
Đối với nhà phát triển AI Agent, việc nắm vững các mô hình này là cực kỳ quan trọng bởi vì agent của bạn sẽ sử dụng chúng để “giao tiếp” với LLM nhằm thực hiện công việc của mình.
Các Mô Hình Prompt Engineering Cốt Lõi
Có rất nhiều mô hình prompt, nhưng chúng ta sẽ tập trung vào những mô hình phổ biến và hữu ích nhất cho việc xây dựng AI Agent.
1. Mô Hình Đóng Vai (Persona Pattern)
Mục đích: Yêu cầu mô hình đảm nhận một vai trò hoặc tính cách cụ thể để định hình giọng điệu, kiến thức nền và phong cách trả lời.
Giải thích: Bằng cách chỉ định rõ ràng mô hình nên đóng vai ai (một chuyên gia, một người bạn, một trợ lý, một nhân vật hư cấu, v.v.), bạn cung cấp cho nó một bộ ngữ cảnh và ràng buộc giúp định hướng câu trả lời một cách tự nhiên và phù hợp với vai trò đó.
Khi nào sử dụng: Khi bạn cần đầu ra có một giọng điệu, phong cách hoặc kiến thức chuyên môn cụ thể. Rất hữu ích khi xây dựng các agent chuyên biệt (ví dụ: agent tư vấn tài chính, agent hỗ trợ khách hàng).
Ví dụ:
Bạn là một chuyên gia marketing dày dặn kinh nghiệm. Nhiệm vụ của bạn là phân tích xu hướng thị trường hiện tại và đề xuất 3 ý tưởng chiến dịch quảng cáo sáng tạo cho sản phẩm A. Đảm bảo các ý tưởng này hướng tới đối tượng Gen Z.
Act as a senior Python developer. Review the following code snippet and provide feedback on its efficiency, readability, and potential bugs. Explain your suggestions clearly.
2. Zero-Shot, Few-Shot và Many-Shot Prompting
Mục đích: Cung cấp cho mô hình các ví dụ về đầu vào và đầu ra mong muốn để giúp nó hiểu rõ tác vụ, đặc biệt là với các định dạng hoặc loại yêu cầu mới.
Giải thích:
- Zero-Shot: Không cung cấp bất kỳ ví dụ nào. Mô hình phải dựa hoàn toàn vào kiến thức được đào tạo để trả lời. Phù hợp với các tác vụ đơn giản, rõ ràng.
- Few-Shot: Cung cấp một vài cặp ví dụ (đầu vào -> đầu ra) trước yêu cầu thực tế. Giúp mô hình hiểu rõ hơn về định dạng, phong cách hoặc loại đầu ra mong muốn. Rất mạnh mẽ để hướng dẫn mô hình theo một khuôn mẫu cụ thể.
- Many-Shot: Cung cấp nhiều ví dụ hơn. Đôi khi cần thiết cho các tác vụ rất phức tạp hoặc yêu cầu độ chính xác cao theo một mẫu nhất định, mặc dù có thể tốn kém về token và cửa sổ ngữ cảnh.
Khi nào sử dụng: Few-Shot rất hữu ích khi cần mô hình tạo ra đầu ra theo một định dạng nhất quán (ví dụ: phân loại văn bản theo các nhãn cụ thể, trích xuất thông tin theo cấu trúc). Zero-Shot thường dùng cho các câu hỏi mở hoặc tác vụ tạo văn bản tự do.
Ví dụ Few-Shot:
Phân loại cảm xúc của đoạn văn sau:
Văn bản: Tôi rất vui khi được gặp bạn.
Cảm xúc: Tích cực
Văn bản: Công việc hôm nay thật mệt mỏi.
Cảm xúc: Tiêu cực
Văn bản: Tôi không chắc về điều này.
Cảm xúc: Trung lập
Văn bản: Dự án đã hoàn thành đúng hạn, thật tuyệt vời!
Cảm xúc: ?
3. Chuỗi Suy Nghĩ (Chain of Thought – CoT)
Mục đích: Khuyến khích mô hình hiển thị các bước suy luận trung gian trước khi đưa ra câu trả lời cuối cùng cho các vấn đề đòi hỏi nhiều bước.
Giải thích: Bằng cách thêm cụm từ như “Hãy suy nghĩ từng bước” hoặc cung cấp các ví dụ CoT (CoT-Prompting), bạn thúc đẩy mô hình thực hiện một chuỗi các bước suy luận logic tương tự như con người. Điều này đặc biệt hiệu quả với các mô hình lớn và giúp cải thiện đáng kể khả năng suy luận của chúng trên các tác vụ phức tạp như số học, suy luận thông thường hoặc lập kế hoạch. Đây là một kỹ thuật nền tảng cho nhiều agent sử dụng LLM để lập kế hoạch hành động.
Khi nào sử dụng: Khi tác vụ yêu cầu suy luận logic, tính toán, hoặc bất kỳ quy trình nào có thể chia thành các bước tuần tự. Cực kỳ quan trọng khi agent cần thực hiện các tác vụ Suy luận và Lập kế hoạch.
Ví dụ:
Có 5 quả táo trong giỏ. Tôi lấy ra 2 quả và sau đó bỏ thêm 3 quả khác vào. Hỏi có bao nhiêu quả táo bây giờ? Hãy suy nghĩ từng bước.
Let's break down the user's request: "Book a flight from London to New York tomorrow and reserve a window seat."
1. Identify the core task: Book a flight.
2. Extract parameters:
- Origin: London
- Destination: New York
- Date: Tomorrow
- Preference: Window seat
3. Determine necessary tools/actions: Flight booking API.
4. Formulate API call...
4. Cấu Trúc Hóa Đầu Ra (Output Structuring)
Mục đích: Yêu cầu mô hình định dạng đầu ra theo một cấu trúc cụ thể (ví dụ: JSON, XML, Markdown, danh sách, bảng).
Giải thích: Điều này đảm bảo rằng đầu ra của mô hình dễ dàng được xử lý tự động bởi các phần mềm hoặc các thành phần khác của agent. Đây là điều cần thiết khi output của LLM không chỉ dành cho con người đọc mà còn là input cho các module khác hoặc công cụ mà agent sử dụng.
Khi nào sử dụng: Luôn luôn khi đầu ra cần được máy tính phân tích cú pháp (parse). Phổ biến trong các tác vụ trích xuất thông tin, tạo dữ liệu cấu trúc, hoặc khi agent cần xuất ra lệnh cho các tool khác.
Ví dụ:
Trích xuất thông tin về tên sản phẩm, giá và đánh giá trung bình từ đoạn văn sau. Định dạng kết quả dưới dạng JSON array.
Đoạn văn: Khách hàng rất thích "Điện thoại XYZ", giá 15.000.000 VND. Sản phẩm này nhận được đánh giá 4.5 sao. Ngoài ra, "Máy tính bảng ABC" cũng khá phổ biến với giá 10.000.000 VND, đánh giá 4.0 sao.
Output JSON:
[
{
"ten_san_pham": "Điện thoại XYZ",
"gia": 15000000,
"danh_gia_trung_binh": 4.5
},
{
"ten_san_pham": "Máy tính bảng ABC",
"gia": 10000000,
"danh_gia_trung_binh": 4.0
}
]
5. Mô Hình Ràng Buộc và Phủ Định (Constraint/Negation Pattern)
Mục đích: Chỉ định những gì mô hình *không* nên làm hoặc bao gồm trong đầu ra.
Giải thích: Đôi khi việc nói cho mô hình biết điều gì là không mong muốn còn hiệu quả hơn là chỉ mô tả điều mong muốn. Bạn có thể đặt ra các ràng buộc về độ dài, phong cách, nội dung cấm, hoặc các yếu tố cần loại trừ.
Khi nào sử dụng: Khi mô hình có xu hướng thêm thông tin không cần thiết, đi lạc đề, hoặc tạo ra nội dung nhạy cảm/không phù hợp. Giúp làm sạch và tập trung đầu ra.
Ví dụ:
Viết một đoạn giới thiệu ngắn về AI Agent. Không sử dụng thuật ngữ "deep learning" hoặc "neural network".
Summarize the article above. Do not exceed 100 words and avoid using passive voice.
6. Mô Hình Lặp Lại và Tinh Chỉnh (Iterative/Refinement)
Mục đích: Cải thiện đầu ra ban đầu của mô hình thông qua các vòng lặp prompt tiếp theo, cung cấp phản hồi hoặc yêu cầu chỉnh sửa.
Giải thích: Đây là cách làm việc rất tự nhiên và hiệu quả với LLM. Bạn nhận được một đầu ra ban đầu, sau đó bạn cung cấp thêm ngữ cảnh, chỉ ra điểm cần cải thiện hoặc yêu cầu mở rộng/rút gọn. Đây là cốt lõi của cách Agent sử dụng LLM trong vòng lặp Suy luận và Hành động.
Khi nào sử dụng: Khi tác vụ phức tạp, yêu cầu sự sáng tạo, hoặc khi bạn cần đầu ra đáp ứng các tiêu chí chủ quan khó mô tả hết trong một prompt duy nhất.
Ví dụ (một chuỗi prompt):
Prompt 1: Viết một đoạn mô tả sản phẩm sáng tạo cho một chiếc giày chạy bộ mới.
Prompt 2 (sau khi nhận kết quả từ Prompt 1): Đoạn mô tả trên khá tốt, nhưng hãy nhấn mạnh hơn vào công nghệ đệm mới và lợi ích cho người chạy marathon.
Prompt 3 (sau khi nhận kết quả từ Prompt 2): Tuyệt vời. Bây giờ, hãy rút gọn đoạn mô tả đó xuống còn dưới 150 ký tự để dùng làm mô tả meta.
7. Mô Hình Phân Rã Tác Vụ (Task Decomposition)
Mục đích: Chia một yêu cầu phức tạp thành các bước nhỏ hơn, sau đó gửi từng bước đó cho mô hình (hoặc các instance mô hình khác nhau) để xử lý tuần tự.
Giải thích: LLM có giới hạn về khả năng xử lý các yêu cầu quá phức tạp hoặc đa nhiệm cùng một lúc. Bằng cách tự động (hoặc thủ công) phân rã yêu cầu thành các bước nhỏ hơn, bạn giảm tải nhận thức cho mô hình và thường nhận được kết quả chính xác hơn cho từng bước, sau đó tổng hợp lại.
Khi nào sử dụng: Đối với các yêu cầu của người dùng rất phức tạp mà agent cần xử lý. Đây là nền tảng của các kỹ thuật lập kế hoạch trong agent như ReAct (Reasoning + Acting) hoặc Plan-and-Execute.
Ví dụ (Agent tự tạo các prompt con):
Yêu cầu gốc của người dùng: "Tìm 3 nhà hàng Ý được đánh giá cao nhất gần đây, xem thực đơn của họ và tổng hợp lại các món pasta phổ biến nhất cùng với mức giá trung bình."
Agent sẽ tạo ra các prompt nội bộ:
Prompt cho Bước 1 (Tìm nhà hàng): "Sử dụng công cụ tìm kiếm nhà hàng, tìm 3 nhà hàng Ý có đánh giá cao nhất trong bán kính 5km từ vị trí hiện tại. Xuất kết quả dưới dạng danh sách tên và địa chỉ." (Sử dụng Tool Use Pattern)
Prompt cho Bước 2 (Xem thực đơn): "Đối với mỗi nhà hàng trong danh sách sau: [Tên nhà hàng 1, Tên nhà hàng 2, Tên nhà hàng 3], sử dụng công cụ truy cập web để tìm thực đơn trực tuyến của họ. Trích xuất nội dung thực đơn." (Sử dụng Tool Use Pattern và Extraction Pattern)
Prompt cho Bước 3 (Tổng hợp): "Từ các thực đơn sau: [Nội dung thực đơn 1, Nội dung thực đơn 2, Nội dung thực đơn 3], xác định 5 món pasta phổ biến nhất (dựa trên số lần xuất hiện hoặc mô tả nổi bật) và ước tính mức giá trung bình của chúng. Định dạng kết quả dưới dạng danh sách Markdown." (Sử dụng Extraction, Aggregation và Output Structuring)
Như bạn thấy, AI Agent sử dụng nhiều mô hình prompt khác nhau trong một quy trình làm việc để hoàn thành một yêu cầu phức tạp.
8. Mô Hình Sử Dụng Công Cụ (Tool Use Pattern)
Mục đích: Hướng dẫn mô hình nhận biết khi nào và làm thế nào để sử dụng các công cụ bên ngoài (như API tìm kiếm, API cơ sở dữ liệu, công cụ tính toán, v.v.) để hoàn thành tác vụ.
Giải thích: Các mô hình ngôn ngữ có giới hạn về kiến thức thời gian thực và khả năng tính toán chính xác. Bằng cách tích hợp các công cụ và hướng dẫn LLM cách gọi chúng thông qua prompt, chúng ta mở rộng đáng kể khả năng của Agent. Mô hình này thường liên quan đến việc định nghĩa cú pháp hoặc “ngôn ngữ” để mô hình biểu thị ý định sử dụng công cụ.
Khi nào sử dụng: Bất cứ khi nào tác vụ yêu cầu truy cập thông tin bên ngoài, thực hiện tính toán chính xác, tương tác với hệ thống khác (ví dụ: gửi email, cập nhật cơ sở dữ liệu). Cốt lõi của các Agent có khả năng tương tác với môi trường bên ngoài. Liên quan chặt chẽ đến các bài về Xây dựng Công cụ AI tốt hơn và Git & REST API.
Ví dụ (sử dụng định dạng ReAct):
Bạn có quyền truy cập vào các công cụ sau:
search(query: string): Tìm kiếm thông tin trên web.
Giải quyết yêu cầu của người dùng: "Tổng thống hiện tại của Pháp là ai?"
Thought: Người dùng hỏi về Tổng thống Pháp. Tôi cần sử dụng công cụ tìm kiếm để tìm thông tin hiện tại.
Action: search("Tổng thống hiện tại của Pháp")
Observation: (Kết quả từ công cụ search: Emmanuel Macron là Tổng thống hiện tại của Pháp.)
Thought: Tôi đã tìm thấy thông tin. Bây giờ tôi có thể trả lời câu hỏi.
Answer: Tổng thống hiện tại của Pháp là Emmanuel Macron.
9. Mô Hình RAG (Retrieval Augmented Generation)
Mục đích: Bổ sung thông tin liên quan được truy xuất từ cơ sở dữ liệu bên ngoài (thường là vector database) vào ngữ cảnh của prompt trước khi gửi đến LLM.
Giải thích: Mô hình RAG cải thiện khả năng của LLM trong việc trả lời các câu hỏi dựa trên kiến thức chuyên biệt, thời gian thực, hoặc không có trong dữ liệu đào tạo ban đầu của nó. Thay vì chỉ dựa vào bộ nhớ trong, agent sẽ sử dụng truy vấn của người dùng hoặc prompt nội bộ để tìm kiếm các đoạn văn bản liên quan trong kho dữ thức bên ngoài (đã được nhúng vector – tìm kiếm vector) và đưa các đoạn đó vào prompt gửi cho LLM.
Khi nào sử dụng: Khi cần LLM trả lời câu hỏi hoặc tổng hợp thông tin từ các tài liệu cụ thể (văn bản nội bộ, tài liệu kỹ thuật, tin tức mới, v.v.). Rất quan trọng cho các agent cần làm việc với lượng lớn thông tin chuyên ngành. Đây là chủ đề của bài viết RAG cho Người mới bắt đầu.
Ví dụ:
Dựa vào các đoạn văn sau, hãy trả lời câu hỏi: "Thác Niagara nằm ở đâu?"
[Đoạn văn 1: ... thông tin không liên quan ...]
[Đoạn văn 2: Thác Niagara là một nhóm thác nước lớn ở sông Niagara, nằm ở biên giới giữa tỉnh Ontario của Canada và tiểu bang New York của Hoa Kỳ.]
[Đoạn văn 3: ... thông tin không liên quan khác ...]
Câu hỏi: Thác Niagara nằm ở đâu?
Ở đây, agent đã sử dụng hệ thống RAG để truy xuất đoạn văn liên quan (Đoạn văn 2) và chèn nó vào prompt trước khi gửi đến LLM.
Tổng Quan Các Mô Hình Prompt Phổ Biến
Để dễ hình dung, dưới đây là bảng tổng hợp một số mô hình chính:
Mô Hình | Mục Đích Chính | Khi Nào Sử Dụng | Lợi Ích Cốt Lõi Cho Agent |
---|---|---|---|
Đóng Vai (Persona) | Định hình giọng điệu, kiến thức, phong cách | Cần đầu ra chuyên biệt theo vai trò/chuyên môn | Giúp Agent có “tính cách” hoặc chuyên môn cụ thể |
Few-Shot | Hướng dẫn định dạng và phong cách đầu ra | Cần đầu ra theo khuôn mẫu nhất quán | Đảm bảo Agent tạo ra output dễ parse hoặc theo yêu cầu |
Chain of Thought (CoT) | Cải thiện khả năng suy luận logic, đa bước | Tác vụ phức tạp, cần lập kế hoạch/phân tích | Nâng cao khả năng Suy luận trong vòng lặp Agent |
Cấu Trúc Hóa Đầu Ra | Đảm bảo đầu ra có định dạng máy đọc được | Đầu ra là input cho module khác hoặc tool | Cho phép Agent xử lý tự động output của LLM |
Phân Rã Tác Vụ | Chia yêu cầu lớn thành các bước nhỏ | Yêu cầu người dùng quá phức tạp | Cơ sở cho khả năng lập kế hoạch phức tạp của Agent |
Sử Dụng Công Cụ (Tool Use) | Hướng dẫn Agent tương tác với thế giới bên ngoài | Cần thông tin thời gian thực, tính toán, hành động bên ngoài | Cho phép Agent thực hiện hành động thực tế |
RAG | Bổ sung kiến thức chuyên biệt vào ngữ cảnh | Cần trả lời dựa trên dữ liệu riêng/thời gian thực | Giúp Agent truy cập và sử dụng kiến thức ngoài |
Ứng Dụng Các Mô Hình Prompt Trong AI Agent
Các mô hình prompt này không chỉ là các kỹ thuật độc lập; chúng thường được kết hợp và sử dụng trong các phần khác nhau của AI Agent. Quay lại vòng lặp Agent:
- Nhận Thức (Perception): Agent có thể sử dụng các prompt để xử lý dữ liệu nhận thức được. Ví dụ: sử dụng Few-Shot và Output Structuring để trích xuất thông tin có cấu trúc từ văn bản hoặc hình ảnh (sau khi xử lý bằng các mô hình thị giác/nghe). RAG được dùng để truy xuất ngữ cảnh liên quan dựa trên quan sát.
- Suy Luận (Reasoning): Đây là nơi CoT và Task Decomposition tỏa sáng. Agent sử dụng CoT để suy nghĩ về các bước cần thực hiện hoặc phân tích vấn đề. Task Decomposition giúp agent chia nhỏ mục tiêu thành các nhiệm vụ con. Persona pattern có thể được dùng để agent suy luận từ góc nhìn của một chuyên gia cụ thể.
- Hành Động (Acting): Tool Use Pattern là trung tâm của giai đoạn này, cho phép agent ra lệnh cho các công cụ bên ngoài. Output Structuring đảm bảo các lệnh này có định dạng đúng để công cụ hiểu được. Iterative/Refinement được sử dụng khi agent nhận được kết quả từ hành động và cần điều chỉnh kế hoạch hoặc thực hiện hành động tiếp theo.
Việc hiểu và áp dụng linh hoạt các mô hình này cho phép bạn xây dựng các agent thông minh, đáng tin cậy và có khả năng giải quyết các vấn đề phức tạp trong thế giới thực.
Lựa Chọn Mô Hình Prompt Phù Hợp
Việc lựa chọn mô hình prompt phụ thuộc vào nhiều yếu tố:
- Bản chất tác vụ: Tác vụ cần suy luận (CoT), trích xuất thông tin (Output Structuring, Few-Shot), sáng tạo (Persona, Iterative), hay tương tác bên ngoài (Tool Use, RAG)?
- Khả năng của LLM: Một số mô hình (như CoT) hoạt động tốt hơn trên các mô hình lớn, có khả năng suy luận mạnh.
- Yêu cầu về đầu ra: Đầu ra cần có định dạng nhất quán (Few-Shot, Output Structuring)? Cần dựa trên kiến thức cụ thể (RAG)?
- Chi phí và hiệu năng: Các prompt dài (Many-Shot, prompt RAG lớn) có thể tốn kém hơn về token và cần nhiều thời gian xử lý hơn.
- Độ tin cậy cần thiết: Đối với các tác vụ quan trọng, việc sử dụng kết hợp các mô hình (ví dụ: CoT + Output Structuring + Iterative) có thể tăng độ tin cậy.
Vượt Ra Ngoài Mô Hình: Các Thực Tiễn Tốt Nhất
Ngoài việc áp dụng các mô hình, đừng quên các nguyên tắc cơ bản của prompt engineering hiệu quả:
- Rõ ràng và Cụ thể: Yêu cầu của bạn càng rõ ràng, mô hình càng dễ hiểu. Tránh sự mơ hồ.
- Cung cấp Ngữ cảnh Đầy đủ: Cung cấp tất cả thông tin cần thiết cho mô hình thực hiện tác vụ.
- Chỉ dẫn Định dạng: Luôn chỉ rõ định dạng đầu ra mong muốn, ngay cả khi không sử dụng mô hình Output Structuring chính thức.
- Lặp lại và Thử nghiệm: Prompt engineering là một quá trình lặp đi lặp lại. Hãy thử nghiệm, phân tích kết quả và điều chỉnh prompt của bạn.
- Hiểu các Tham số Khác: Nắm vững cách các tham số như Temperature, Top-p ảnh hưởng đến sự ngẫu nhiên và tính sáng tạo của đầu ra.
Kết Luận
Prompt Engineering là một kỹ năng không thể thiếu trên con đường trở thành nhà phát triển AI Agent chuyên nghiệp. Việc áp dụng các mô hình prompt không chỉ giúp bạn đạt được kết quả tốt hơn từ LLM mà còn mang lại tính cấu trúc, nhất quán và đáng tin cậy cho các agent của bạn. Các mô hình như Persona, Few-Shot, CoT, Output Structuring, Task Decomposition, Tool Use và RAG là những công cụ mạnh mẽ giúp Agent của bạn “nhận thức”, “suy luận” và “hành động” một cách hiệu quả hơn.
Khi bạn xây dựng các agent phức tạp hơn, bạn sẽ thấy mình liên tục kết hợp và tùy chỉnh các mô hình này để giải quyết các thách thức cụ thể. Hãy coi chúng như các “thiết kế mẫu” (design patterns) trong lập trình truyền thống – chúng cung cấp giải pháp đã được kiểm chứng cho các vấn đề thường gặp.
Trong các bài viết tiếp theo của series “AI Agent Roadmap”, chúng ta sẽ tiếp tục khám phá các khía cạnh sâu hơn trong việc xây dựng và triển khai AI Agent. Hẹn gặp lại các bạn!