Tìm hiểu các thành phần cấu tạo nên mọi AI agent — định nghĩa mục tiêu, vòng lặp suy luận, tích hợp công cụ, hệ thống bộ nhớ và chiến lược đánh giá.
Trong Bài học 1, bạn đã tìm hiểu agent là gì. Bây giờ, hãy cùng tìm hiểu cách chúng hoạt động bên trong — kiến trúc giúp cho hành vi tự chủ trở nên khả thi.
Vòng lặp suy luận
Mọi AI agent đều hoạt động theo một vòng lặp. Nó trông có vẻ đơn giản:
Quan sát — Tình trạng hiện tại là gì? Tôi biết gì? Tôi đã làm gì cho đến nay?
Suy nghĩ — Với mục tiêu và tình trạng hiện tại, tôi nên làm gì tiếp theo?
Hành động — Thực hiện bước tiếp theo bằng cách sử dụng các công cụ có sẵn
Đánh giá — Điều đó có hiệu quả không? Tôi đã gần đạt được mục tiêu hơn chưa?
Lặp lại — Nếu mục tiêu không đạt được, hãy quay lại bước 1
Vòng lặp này chạy cho đến khi agent đạt được mục tiêu, chạm đến giới hạn (số bước tối đa, thời gian, ngân sách) hoặc bị kẹt và yêu cầu trợ giúp.
Điều kỳ diệu nằm ở bước 2 — bước "suy nghĩ". Các mô hình ngôn ngữ hiện đại đủ tốt để lập kế hoạch, suy luận về những tình huống phức tạp và thích ứng khi mọi thứ không diễn ra như mong đợi.
📍 Nơi dán: Mở ChatGPT (chat.openai.com), Claude (claude.ai) hoặc Gemini (gemini.google.com) và bắt đầu một cuộc trò chuyện mới.
📋 Cách sao chép prompt này: Nhấp vào bất kỳ đâu bên trong khối màu xám, nhấn Cmd+A rồi Cmd+C (Mac) hoặc Ctrl+A rồi Ctrl+C (Windows). Hoặc sử dụng biểu tượng sao chép xuất hiện.
Trình bày vòng lặp suy luận cho nhiệm vụ của agent này:
MỤC TIÊU: Tìm ba chuyến bay rẻ nhất từ New York đến London trong khoảng thời gian 15-22 tháng 3 năm 2026
Đi qua vòng lặp từng bước:
1. Agent quan sát thấy gì ban đầu?
2. Nó suy nghĩ/lập kế hoạch gì?
3. Nó thực hiện hành động đầu tiên nào?
4. Nó quan sát thấy gì sau hành động đó?
5. Nó đánh giá và quyết định bước tiếp theo như thế nào?
Tiếp tục cho đến khi đạt được mục tiêu (sử dụng kết quả giả định).
✏️ Cách điền thông tin chi tiết: Thay thế mỗi dấu ngoặc vuông [] và trình giữ chỗ trong ngoặc bằng thông tin cụ thể từ tình huống thực tế của bạn. Thông tin đầu vào mơ hồ sẽ tạo ra kết quả mơ hồ — hãy cụ thể.
👀 Những gì bạn sẽ thấy: Trong vòng vài giây, AI sẽ trả về một phản hồi có cấu trúc dựa trên prompt ở trên. Hãy đọc kỹ và coi đó là bản nháp, không phải câu trả lời cuối cùng.
📌 Nên làm gì với kết quả: Lưu phản hồi vào file Notes. Chọn gợi ý có hiệu quả cao nhất và thực hiện nó trong tuần này — đừng cố gắng làm tất cả cùng một lúc.
⚠️ Nếu kết quả không ổn: Nếu các gợi ý có vẻ chung chung, hãy dán nội dung sau: "Hãy cụ thể hơn với ngữ cảnh thực tế của tôi. Bỏ lời khuyên chung chung." Nếu nó bỏ qua các chi tiết quan trọng bạn đã cung cấp, hãy hỏi: "Bạn đã bỏ sót [X] trong ngữ cảnh của tôi — hãy thực hiện lại với điều đó làm ràng buộc chính."
✅ Kiểm tra nhanh: 5 bước trong vòng lặp suy luận của agent là gì?
Quan sát (đánh giá trạng thái hiện tại), Suy nghĩ (lập kế hoạch hành động tiếp theo), Hành động (thực hiện bằng công cụ), Đánh giá (kiểm tra tiến độ hướng tới mục tiêu), Lặp lại (vòng lặp cho đến khi hoàn thành). Chu trình này là động lực thúc đẩy mọi hành vi của agent tự động.
Thiết kế mục tiêu
Một mục tiêu được định nghĩa kém sẽ tạo ra một agent hoạt động kém hiệu quả. Các mục tiêu tốt tuân theo framework SMART-A dành cho agent:
Cụ thể — "Nghiên cứu 5 nền tảng CRM hàng đầu dành cho doanh nghiệp nhỏ" tốt hơn "nghiên cứu CRM".
Có thể đo lường — Làm thế nào để agent biết khi nào công việc hoàn thành? "Tạo một bảng so sánh với giá cả, tính năng và xếp hạng cho 5 nền tảng."
Có thể đạt được — Agent phải có các công cụ để hoàn thành mục tiêu. Đừng yêu cầu một agent không có quyền truy cập web nghiên cứu giá hiện tại.
Phù hợp — Mục tiêu phải phù hợp với khả năng của agent. Đừng yêu cầu một agent nghiên cứu thực hiện các giao dịch tài chính.
Giới hạn thời gian/số bước — Đặt giới hạn về thời gian hoặc số bước mà agent có thể thực hiện. Nếu không có giới hạn, agent có thể lặp lại vô thời hạn.
Tôi muốn tạo mục tiêu agent cho nhiệm vụ này: [mô tả nhiệm vụ của bạn]
Hãy giúp tôi viết mục tiêu theo framework SMART-A:
1. Cụ thể: Agent cần tạo ra chính xác điều gì?
2. Đo lường được: Làm thế nào để xác minh đầu ra là đầy đủ và chính xác?
3. Khả thi: Agent cần những công cụ nào?
4. Phù hợp: Nhiệm vụ này có nằm trong khả năng của agent không?
5. Có giới hạn thời gian: Giới hạn bước/thời gian hợp lý là bao nhiêu?
Hãy viết câu mục tiêu cuối cùng mà tôi sẽ đưa cho agent.
Kiến trúc công cụ
Các công cụ là thứ làm cho agent trở nên hơn cả chatbot. Công cụ là bất kỳ khả năng nào mà agent có thể sử dụng:
Loại công cụ
Chức năng của nó
Ví dụ
Tìm kiếm web
Tìm kiếm thông tin hiện tại
Tìm kiếm giá của đối thủ cạnh tranh
Thực thi code
hực hiện các phép tính hoặc script
Phân tích dữ liệu bán hàng dưới dạng CSV
Truy cập file
Đọc và viết tài liệu
Đọc hợp đồng dạng PDF, viết báo cáo
Gọi API
Tương tác với các dịch vụ bên ngoài
Kiểm tra tồn kho, gửi email, cập nhật CRM
Truy vấn cơ sở dữ liệu
Truy xuất dữ liệu có cấu trúc
Tìm tất cả khách hàng có hóa đơn quá hạn
Kiểm soát trình duyệt
Điều hướng trang web
Điền vào biểu mẫu, trích xuất dữ liệu trang sản phẩm
Hệ thống tự động hóa quyết định sử dụng công cụ nào dựa trên bước hiện tại. Nghiên cứu đối thủ cạnh tranh? Sử dụng tìm kiếm trên web. Phân tích dữ liệu? Sử dụng thực thi code. Viết báo cáo? Sử dụng ghi file.
Thiết kế bộ công cụ của bạn:
Tôi đang xây dựng một hệ thống tự động hóa cho [nhiệm vụ]. Hãy giúp tôi thiết kế bộ công cụ của nó:
1. Hệ thống tự động hóa cần những công cụ nào để hoàn thành mục tiêu này?
2. Mỗi công cụ yêu cầu đầu vào nào?
3. Mỗi công cụ tạo ra đầu ra nào?
4. Có công cụ nào là "nên có" so với "cần thiết" không?
5. Điều gì xảy ra nếu một công cụ bị lỗi hoặc trả về kết quả không mong muốn?
Hệ thống bộ nhớ
Hệ thống tự động hóa cần bộ nhớ để hoạt động hiệu quả. Ba loại bộ nhớ quan trọng:
Bộ nhớ làm việc — Những gì hệ thống tự động hóa đang suy nghĩ. Bước hiện tại, kết quả công cụ gần đây và ngữ cảnh tức thời. Đây thường là cửa sổ hội thoại/ngữ cảnh.
Bộ nhớ theo sự kiện — Những gì đã xảy ra trong nhiệm vụ này. Các bước đã thực hiện, kết quả nhận được, lỗi gặp phải. Điều này ngăn hệ thống tự động hóa lặp lại các phương pháp đã thất bại.
Bộ nhớ bền vững — Kiến thức tồn tại qua nhiều phiên. Sở thích người dùng, kết quả nghiên cứu trước đó, các mẫu đã học. Hữu ích cho các agent chạy lặp đi lặp lại.
Hầu hết các framework agent hiện nay xử lý bộ nhớ làm việc tự động (đó là cửa sổ ngữ cảnh của mô hình). Bộ nhớ theo sự kiện yêu cầu thiết kế có chủ đích — ghi nhật ký hành động và kết quả. Bộ nhớ bền vững thường sử dụng cơ sở dữ liệu hoặc file.
✅ Kiểm tra nhanh: Một agent nghiên cứu liên tục lặp lại cùng một truy vấn tìm kiếm không thành công trong các lần chạy khác nhau. Loại bộ nhớ nào bị thiếu và bạn sẽ lưu trữ nó ở đâu?
Bộ nhớ theo sự kiện — agent không ghi lại rằng "truy vấn này không trả về kết quả nào lần trước, hãy thử một góc độ khác." Hãy lưu trữ nó trong nhật ký có cấu trúc (JSON hoặc hàng cơ sở dữ liệu) được liên kết với ID tác vụ, sau đó hiển thị danh sách các lần thử không thành công trở lại prompt tiếp theo để mô hình có thể tránh chúng.
Các mẫu agent
Các tác vụ khác nhau yêu cầu những kiến trúc agent khác nhau:
Agent tuần tự — Các bước được thực hiện theo thứ tự: nghiên cứu → phân tích → viết → đánh giá. Tốt nhất cho các tác vụ có luồng tuyến tính rõ ràng.
Agent phân nhánh — Agent quyết định giữa các đường dẫn dựa trên những gì nó tìm thấy. "Nếu dữ liệu có cấu trúc, hãy phân tích trực tiếp. Nếu không có cấu trúc, hãy trích xuất và làm sạch trước." Phù hợp nhất cho các tác vụ có logic điều kiện.
Agent lặp lại — Agent lặp lại một quy trình cho đến khi chất lượng đạt yêu cầu. "Viết bản nháp, đánh giá, cải thiện các phần yếu, đánh giá lại." Phù hợp nhất cho các tác vụ sáng tạo hoặc nhạy cảm về chất lượng.
Agent song song — Nhiều tác vụ con chạy đồng thời. "Nghiên cứu Công ty A, B và C cùng một lúc, sau đó kết hợp các phát hiện." Phù hợp nhất cho các tác vụ mà các bước không phụ thuộc vào nhau.
Đối với nhiệm vụ này, mô hình agent nào phù hợp nhất? Giải thích tại sao:
NHIỆM VỤ: [mô tả nhiệm vụ của bạn]
So sánh 4 mô hình (tuần tự, phân nhánh, lặp, song song) và đề xuất kiến trúc tốt nhất. Bao gồm một sơ đồ thể hiện cách các bước sẽ diễn ra.
Bài tập: Thiết kế kiến trúc cho agent
Chọn một nhiệm vụ thực tế mà bạn muốn agent xử lý và thiết kế kiến trúc hoàn chỉnh:
Viết mục tiêu bằng framework SMART-A
Liệt kê các công cụ mà agent cần
Vẽ sơ đồ vòng lặp suy luận cho nhiệm vụ cụ thể này (mỗi chu kỳ quan sát-suy nghĩ-hành động-đánh giá trông như thế nào?)
Chọn mô hình agent (tuần tự, phân nhánh, lặp lại hoặc song song)
Xác định bộ nhớ mà agent cần
Sử dụng AI để giúp tinh chỉnh từng thành phần. Lưu kiến trúc này — bạn sẽ xây dựng nó thành một agent hoạt động trong bài học tiếp theo.
Những điểm chính cần ghi nhớ
Vòng lặp suy luận (quan sát, suy nghĩ, hành động, đánh giá, lặp lại) là động cơ của mọi AI agent
Các mục tiêu được xác định rõ ràng bằng cách sử dụng framework SMART-A tạo ra hiệu suất agent tốt hơn đáng kể
Các công cụ cung cấp cho agent khả năng vượt xa việc tạo văn bản: tìm kiếm, code, file, API, cơ sở dữ liệu và điều khiển trình duyệt
Ba loại bộ nhớ quan trọng: Bộ nhớ làm việc (ngữ cảnh hiện tại), bộ nhớ theo sự kiện (lịch sử tác vụ) và bộ nhớ bền vững (kiến thức xuyên phiên)
Bốn mô hình agent bao gồm hầu hết các trường hợp sử dụng: tuần tự, phân nhánh, lặp lại và song song
Thiết kế kiến trúc trước khi xây dựng giúp tránh lãng phí công sức và kết quả không đáng tin cậy
Câu 1:
Sự khác biệt giữa agent phản ứng và agent lập kế hoạch là gì?
GIẢI THÍCH:
Agent phản ứng xử lý từng bước một mà không có kế hoạch tổng thể — hữu ích cho các nhiệm vụ đơn giản. Những chuyên viên lập kế hoạch tạo ra một kế hoạch tổng thể (hoặc ít nhất là một chiến lược sơ bộ) và sau đó thực hiện từng bước, điều chỉnh khi cần thiết. Các nhiệm vụ phức tạp được hưởng lợi từ việc lập kế hoạch vì nó giúp tránh lãng phí công sức và giữ cho agent đi đúng hướng.
Câu 2:
Bộ nhớ đóng vai trò gì trong vòng lặp suy luận của AI agent?
GIẢI THÍCH:
Nếu không có bộ nhớ, một agent sẽ lặp lại các phương pháp thất bại tương tự. Bộ nhớ cho phép agent theo dõi các bước đã hoàn thành (Tôi đã nghiên cứu Công ty A và B), lưu giữ những phát hiện (Giá của Công ty A cao hơn 20%) và ghi nhớ các thất bại (API của Công ty C bị lỗi, hãy thử nguồn khác). Đây là điều làm cho các agent thích ứng thay vì lặp lại.
Câu 3:
Tại sao việc chia nhỏ mục tiêu lại quan trọng đối với các AI agent?
GIẢI THÍCH:
Các mục tiêu phức tạp như 'tạo phân tích thị trường' quá mơ hồ để thực hiện trực tiếp. Việc chia nhỏ nó thành 'xác định đối thủ cạnh tranh → thu thập dữ liệu giá cả → phân tích xu hướng → so sánh các tính năng → viết tóm tắt' cung cấp cho agent những bước rõ ràng, có thể kiểm chứng. Mỗi nhiệm vụ phụ đều có một kết quả đầu ra có thể đo lường được mà agent có thể đánh giá trước khi chuyển sang nhiệm vụ tiếp theo.
Theo Nghị định 147/2024/ND-CP, bạn cần xác thực tài khoản trước khi sử dụng tính năng này. Chúng tôi sẽ gửi mã xác thực qua SMS hoặc Zalo tới số điện thoại mà bạn nhập dưới đây: