Kiến trúc agent: Mục tiêu, công cụ và lý luận

Trần Mến

Bài trước

Bài sau

Tìm hiểu các thành phần cấu tạo nên mọi AI agent — định nghĩa mục tiêu, vòng lặp suy luận, tích hợp công cụ, hệ thống bộ nhớ và chiến lược đánh giá.

Trong Bài học 1, bạn đã tìm hiểu agent là gì. Bây giờ, hãy cùng tìm hiểu cách chúng hoạt động bên trong — kiến trúc giúp cho hành vi tự chủ trở nên khả thi.

Vòng lặp suy luận

Mọi AI agent đều hoạt động theo một vòng lặp. Nó trông có vẻ đơn giản:

Quan sát — Tình trạng hiện tại là gì? Tôi biết gì? Tôi đã làm gì cho đến nay?
Suy nghĩ — Với mục tiêu và tình trạng hiện tại, tôi nên làm gì tiếp theo?
Hành động — Thực hiện bước tiếp theo bằng cách sử dụng các công cụ có sẵn
Đánh giá — Điều đó có hiệu quả không? Tôi đã gần đạt được mục tiêu hơn chưa?
Lặp lại — Nếu mục tiêu không đạt được, hãy quay lại bước 1

Vòng lặp này chạy cho đến khi agent đạt được mục tiêu, chạm đến giới hạn (số bước tối đa, thời gian, ngân sách) hoặc bị kẹt và yêu cầu trợ giúp.

Điều kỳ diệu nằm ở bước 2 — bước "suy nghĩ". Các mô hình ngôn ngữ hiện đại đủ tốt để lập kế hoạch, suy luận về những tình huống phức tạp và thích ứng khi mọi thứ không diễn ra như mong đợi.

📍 Nơi dán: Mở ChatGPT (chat.openai.com), Claude (claude.ai) hoặc Gemini (gemini.google.com) và bắt đầu một cuộc trò chuyện mới.

📋 Cách sao chép prompt này: Nhấp vào bất kỳ đâu bên trong khối màu xám, nhấn Cmd+A rồi Cmd+C (Mac) hoặc Ctrl+A rồi Ctrl+C (Windows). Hoặc sử dụng biểu tượng sao chép xuất hiện.

Trình bày vòng lặp suy luận cho nhiệm vụ của agent này:

MỤC TIÊU: Tìm ba chuyến bay rẻ nhất từ New York đến London trong khoảng thời gian 15-22 tháng 3 năm 2026

Đi qua vòng lặp từng bước:
1. Agent quan sát thấy gì ban đầu?
2. Nó suy nghĩ/lập kế hoạch gì?
3. Nó thực hiện hành động đầu tiên nào?
4. Nó quan sát thấy gì sau hành động đó?
5. Nó đánh giá và quyết định bước tiếp theo như thế nào?
Tiếp tục cho đến khi đạt được mục tiêu (sử dụng kết quả giả định).

✏️ Cách điền thông tin chi tiết: Thay thế mỗi dấu ngoặc vuông [] và trình giữ chỗ trong ngoặc bằng thông tin cụ thể từ tình huống thực tế của bạn. Thông tin đầu vào mơ hồ sẽ tạo ra kết quả mơ hồ — hãy cụ thể.

👀 Những gì bạn sẽ thấy: Trong vòng vài giây, AI sẽ trả về một phản hồi có cấu trúc dựa trên prompt ở trên. Hãy đọc kỹ và coi đó là bản nháp, không phải câu trả lời cuối cùng.

📌 Nên làm gì với kết quả: Lưu phản hồi vào file Notes. Chọn gợi ý có hiệu quả cao nhất và thực hiện nó trong tuần này — đừng cố gắng làm tất cả cùng một lúc.

⚠️ Nếu kết quả không ổn: Nếu các gợi ý có vẻ chung chung, hãy dán nội dung sau: "Hãy cụ thể hơn với ngữ cảnh thực tế của tôi. Bỏ lời khuyên chung chung." Nếu nó bỏ qua các chi tiết quan trọng bạn đã cung cấp, hãy hỏi: "Bạn đã bỏ sót [X] trong ngữ cảnh của tôi — hãy thực hiện lại với điều đó làm ràng buộc chính."

✅ Kiểm tra nhanh: 5 bước trong vòng lặp suy luận của agent là gì?

Quan sát (đánh giá trạng thái hiện tại), Suy nghĩ (lập kế hoạch hành động tiếp theo), Hành động (thực hiện bằng công cụ), Đánh giá (kiểm tra tiến độ hướng tới mục tiêu), Lặp lại (vòng lặp cho đến khi hoàn thành). Chu trình này là động lực thúc đẩy mọi hành vi của agent tự động.

Thiết kế mục tiêu

Một mục tiêu được định nghĩa kém sẽ tạo ra một agent hoạt động kém hiệu quả. Các mục tiêu tốt tuân theo framework SMART-A dành cho agent:

Cụ thể — "Nghiên cứu 5 nền tảng CRM hàng đầu dành cho doanh nghiệp nhỏ" tốt hơn "nghiên cứu CRM".

Có thể đo lường — Làm thế nào để agent biết khi nào công việc hoàn thành? "Tạo một bảng so sánh với giá cả, tính năng và xếp hạng cho 5 nền tảng."

Có thể đạt được — Agent phải có các công cụ để hoàn thành mục tiêu. Đừng yêu cầu một agent không có quyền truy cập web nghiên cứu giá hiện tại.

Phù hợp — Mục tiêu phải phù hợp với khả năng của agent. Đừng yêu cầu một agent nghiên cứu thực hiện các giao dịch tài chính.

Giới hạn thời gian/số bước — Đặt giới hạn về thời gian hoặc số bước mà agent có thể thực hiện. Nếu không có giới hạn, agent có thể lặp lại vô thời hạn.

Tôi muốn tạo mục tiêu agent cho nhiệm vụ này: [mô tả nhiệm vụ của bạn]

Hãy giúp tôi viết mục tiêu theo framework SMART-A:
1. Cụ thể: Agent cần tạo ra chính xác điều gì?
2. Đo lường được: Làm thế nào để xác minh đầu ra là đầy đủ và chính xác?
3. Khả thi: Agent cần những công cụ nào?
4. Phù hợp: Nhiệm vụ này có nằm trong khả năng của agent không?
5. Có giới hạn thời gian: Giới hạn bước/thời gian hợp lý là bao nhiêu?

Hãy viết câu mục tiêu cuối cùng mà tôi sẽ đưa cho agent.

Kiến trúc công cụ

Các công cụ là thứ làm cho agent trở nên hơn cả chatbot. Công cụ là bất kỳ khả năng nào mà agent có thể sử dụng:

Loại công cụ	Chức năng của nó	Ví dụ
Tìm kiếm web	Tìm kiếm thông tin hiện tại	Tìm kiếm giá của đối thủ cạnh tranh
Thực thi code	hực hiện các phép tính hoặc script	Phân tích dữ liệu bán hàng dưới dạng CSV
Truy cập file	Đọc và viết tài liệu	Đọc hợp đồng dạng PDF, viết báo cáo
Gọi API	Tương tác với các dịch vụ bên ngoài	Kiểm tra tồn kho, gửi email, cập nhật CRM
Truy vấn cơ sở dữ liệu	Truy xuất dữ liệu có cấu trúc	Tìm tất cả khách hàng có hóa đơn quá hạn
Kiểm soát trình duyệt	Điều hướng trang web	Điền vào biểu mẫu, trích xuất dữ liệu trang sản phẩm

Hệ thống tự động hóa quyết định sử dụng công cụ nào dựa trên bước hiện tại. Nghiên cứu đối thủ cạnh tranh? Sử dụng tìm kiếm trên web. Phân tích dữ liệu? Sử dụng thực thi code. Viết báo cáo? Sử dụng ghi file.

Thiết kế bộ công cụ của bạn:

Tôi đang xây dựng một hệ thống tự động hóa cho [nhiệm vụ]. Hãy giúp tôi thiết kế bộ công cụ của nó:

1. Hệ thống tự động hóa cần những công cụ nào để hoàn thành mục tiêu này?
2. Mỗi công cụ yêu cầu đầu vào nào?
3. Mỗi công cụ tạo ra đầu ra nào?
4. Có công cụ nào là "nên có" so với "cần thiết" không?
5. Điều gì xảy ra nếu một công cụ bị lỗi hoặc trả về kết quả không mong muốn?

Hệ thống bộ nhớ

Hệ thống tự động hóa cần bộ nhớ để hoạt động hiệu quả. Ba loại bộ nhớ quan trọng:

Bộ nhớ làm việc — Những gì hệ thống tự động hóa đang suy nghĩ. Bước hiện tại, kết quả công cụ gần đây và ngữ cảnh tức thời. Đây thường là cửa sổ hội thoại/ngữ cảnh.

Bộ nhớ theo sự kiện — Những gì đã xảy ra trong nhiệm vụ này. Các bước đã thực hiện, kết quả nhận được, lỗi gặp phải. Điều này ngăn hệ thống tự động hóa lặp lại các phương pháp đã thất bại.

Bộ nhớ bền vững — Kiến thức tồn tại qua nhiều phiên. Sở thích người dùng, kết quả nghiên cứu trước đó, các mẫu đã học. Hữu ích cho các agent chạy lặp đi lặp lại.

Hầu hết các framework agent hiện nay xử lý bộ nhớ làm việc tự động (đó là cửa sổ ngữ cảnh của mô hình). Bộ nhớ theo sự kiện yêu cầu thiết kế có chủ đích — ghi nhật ký hành động và kết quả. Bộ nhớ bền vững thường sử dụng cơ sở dữ liệu hoặc file.

✅ Kiểm tra nhanh: Một agent nghiên cứu liên tục lặp lại cùng một truy vấn tìm kiếm không thành công trong các lần chạy khác nhau. Loại bộ nhớ nào bị thiếu và bạn sẽ lưu trữ nó ở đâu?

Bộ nhớ theo sự kiện — agent không ghi lại rằng "truy vấn này không trả về kết quả nào lần trước, hãy thử một góc độ khác." Hãy lưu trữ nó trong nhật ký có cấu trúc (JSON hoặc hàng cơ sở dữ liệu) được liên kết với ID tác vụ, sau đó hiển thị danh sách các lần thử không thành công trở lại prompt tiếp theo để mô hình có thể tránh chúng.

Các mẫu agent

Các tác vụ khác nhau yêu cầu những kiến trúc agent khác nhau:

Agent tuần tự — Các bước được thực hiện theo thứ tự: nghiên cứu → phân tích → viết → đánh giá. Tốt nhất cho các tác vụ có luồng tuyến tính rõ ràng.

Agent phân nhánh — Agent quyết định giữa các đường dẫn dựa trên những gì nó tìm thấy. "Nếu dữ liệu có cấu trúc, hãy phân tích trực tiếp. Nếu không có cấu trúc, hãy trích xuất và làm sạch trước." Phù hợp nhất cho các tác vụ có logic điều kiện.

Agent lặp lại — Agent lặp lại một quy trình cho đến khi chất lượng đạt yêu cầu. "Viết bản nháp, đánh giá, cải thiện các phần yếu, đánh giá lại." Phù hợp nhất cho các tác vụ sáng tạo hoặc nhạy cảm về chất lượng.

Agent song song — Nhiều tác vụ con chạy đồng thời. "Nghiên cứu Công ty A, B và C cùng một lúc, sau đó kết hợp các phát hiện." Phù hợp nhất cho các tác vụ mà các bước không phụ thuộc vào nhau.

Đối với nhiệm vụ này, mô hình agent nào phù hợp nhất? Giải thích tại sao:

NHIỆM VỤ: [mô tả nhiệm vụ của bạn]

So sánh 4 mô hình (tuần tự, phân nhánh, lặp, song song) và đề xuất kiến trúc tốt nhất. Bao gồm một sơ đồ thể hiện cách các bước sẽ diễn ra.

Bài tập: Thiết kế kiến trúc cho agent

Chọn một nhiệm vụ thực tế mà bạn muốn agent xử lý và thiết kế kiến trúc hoàn chỉnh:

Viết mục tiêu bằng framework SMART-A
Liệt kê các công cụ mà agent cần
Vẽ sơ đồ vòng lặp suy luận cho nhiệm vụ cụ thể này (mỗi chu kỳ quan sát-suy nghĩ-hành động-đánh giá trông như thế nào?)
Chọn mô hình agent (tuần tự, phân nhánh, lặp lại hoặc song song)
Xác định bộ nhớ mà agent cần

Sử dụng AI để giúp tinh chỉnh từng thành phần. Lưu kiến trúc này — bạn sẽ xây dựng nó thành một agent hoạt động trong bài học tiếp theo.

Những điểm chính cần ghi nhớ

Vòng lặp suy luận (quan sát, suy nghĩ, hành động, đánh giá, lặp lại) là động cơ của mọi AI agent
Các mục tiêu được xác định rõ ràng bằng cách sử dụng framework SMART-A tạo ra hiệu suất agent tốt hơn đáng kể
Các công cụ cung cấp cho agent khả năng vượt xa việc tạo văn bản: tìm kiếm, code, file, API, cơ sở dữ liệu và điều khiển trình duyệt
Ba loại bộ nhớ quan trọng: Bộ nhớ làm việc (ngữ cảnh hiện tại), bộ nhớ theo sự kiện (lịch sử tác vụ) và bộ nhớ bền vững (kiến thức xuyên phiên)
Bốn mô hình agent bao gồm hầu hết các trường hợp sử dụng: tuần tự, phân nhánh, lặp lại và song song
Thiết kế kiến trúc trước khi xây dựng giúp tránh lãng phí công sức và kết quả không đáng tin cậy

Thứ Ba, 26/05/2026 11:39

5 ★ 1 👨

Bạn nên đọc

Xác thực tài khoản!

Theo Nghị định 147/2024/ND-CP, bạn cần xác thực tài khoản trước khi sử dụng tính năng này. Chúng tôi sẽ gửi mã xác thực qua SMS hoặc Zalo tới số điện thoại mà bạn nhập dưới đây:

Số điện thoại chưa đúng định dạng!

0 Bình luận

Sắp xếp theo

Xóa Đăng nhập để Gửi

AI Agents

Giấy phép số 362/GP-BTTTT. Bộ Thông tin và Truyền thông cấp ngày 30/06/2016. Cơ quan chủ quản: CÔNG TY CỔ PHẦN MẠNG TRỰC TUYẾN META. Địa chỉ: 56 Duy Tân, Phường Cầu Giấy, Hà Nội. Điện thoại: 024 2242 6188. Email: info@meta.vn. Chịu trách nhiệm nội dung: Lê Ngọc Lam.

Kiến trúc agent: Mục tiêu, công cụ và lý luận

Vòng lặp suy luận

Thiết kế mục tiêu

Kiến trúc công cụ

Hệ thống bộ nhớ

Các mẫu agent

Bài tập: Thiết kế kiến ​​trúc cho agent

Những điểm chính cần ghi nhớ

Kết quả luyện tập

Bạn nên đọc

Tạo AI agent đầu tiên của bạn trong 30 phút

Điều phối trong hệ thống AI multi-agent: Tuần tự, song song và phân cấp

Các giao thức và giao tiếp agent

AI Agent là gì? Tại sao lại cần đến nó vào thời điểm này?

Xây dựng AI agent cho doanh nghiệp của bạn

Các chế độ lỗi và gỡ lỗi trong hệ thống AI multi-agent

Vì sao một agent là không đủ?

Xây dựng hệ thống Multi-agent của bạn

Triển khai hệ thống multi-agent trong thế giới thực

Bài tập: Thiết kế kiến trúc cho agent