Xây dựng hệ thống kỹ thuật tạo ngữ cảnh của bạn

Trần Mến

Bạn đã dành 7 bài học để xây dựng lý thuyết, kỹ thuật và các mô hình của kỹ thuật tạo ngữ cảnh. Giờ là lúc xây dựng một thứ gì đó thực tế.

🔄 Tóm tắt nhanh: Đây là những gì chúng ta đã học — Bài 1: Kỹ thuật viết prompt so với kỹ thuật tạo ngữ cảnh và phép ẩn dụ CPU/RAM. Bài 2: Cửa sổ ngữ cảnh như bộ nhớ làm việc, phân bổ ngân sách token, vấn đề "mất tích giữa chừng". Bài 3: 4 kỹ thuật cốt lõi (Ghi, Chọn lọc, Nén, Tách biệt). Bài 4: Cấu trúc bằng thẻ XML, prompt hệ thống và các ví dụ few-shot thực hiện. Bài 5: Hệ thống bộ nhớ - phiên, bộ nhớ dài hạn và RAG. Bài 6: Ngăn xếp ngữ cảnh agent và các file cấu hình. Bài 7: Các mô hình và phản mô hình trong thế giới thực. Bài tập cuối khóa này tích hợp tất cả những điều đó.

Bài tập cuối khóa: Xây dựng hệ thống kỹ thuật tạo ngữ cảnh của bạn

Bạn sẽ xây dựng một hệ thống kỹ thuật tạo ngữ cảnh hoàn chỉnh cho một dự án hoặc quy trình làm việc thực tế mà bạn thực sự sử dụng. Không phải là giả thuyết. Một thứ bạn sẽ triển khai vào ngày mai.

Sau khi hoàn thành bài học này, bạn sẽ có:

Bản đánh giá về việc sử dụng AI hiện tại của bạn
Sơ đồ kiến trúc ngữ cảnh
File cấu hình hoạt động
Chiến lược bộ nhớ
Kế hoạch thử nghiệm

Hãy cùng đi từng bước.

Bước 1: Đánh giá việc sử dụng AI hiện tại của bạn

Trước khi xây dựng bất cứ điều gì, hãy xác định vị trí hiện tại của bạn. Lấy một cuốn sổ tay (hoặc một tài liệu trống) và trả lời những câu hỏi sau về tuần vừa qua:

Bạn thực hiện những tác vụ AI nào lặp đi lặp lại? Liệt kê mọi tác vụ thường xuyên lặp lại. Xem xét code. Soạn thảo email. Phân tích dữ liệu. Tóm tắt cuộc họp. Nghiên cứu. Viết nội dung. Hãy cụ thể — "viết email tiếp thị" tốt hơn là "viết".

Bạn giải thích lại điều gì trong mỗi phiên làm việc? Đây là manh mối quan trọng nhất. Mỗi thông tin bạn lặp lại trong các phiên làm việc là một mảnh ghép còn thiếu của ngữ cảnh xuyên suốt. Những nguyên nhân thường gặp:

Ngăn xếp công nghệ và quy ước của dự án
Giọng điệu thương hiệu và đối tượng
Thuật ngữ chuyên ngành
Sở thích định dạng đầu ra
Vai trò và trách nhiệm của bạn

AI mắc lỗi ở đâu? Liệt kê 5 lần gần nhất AI tạo ra thứ gì đó mà bạn phải chỉnh sửa hoặc thực hiện lại rất nhiều. Với mỗi trường hợp, hãy tự hỏi: Vấn đề là do khả năng (AI không thể làm điều này) hay do ngữ cảnh (AI không biết điều gì đó cần thiết)?

Hầu hết các trường hợp? Đó là do ngữ cảnh.

Ngân sách token hiện tại của bạn là bao nhiêu? Bạn đang cung cấp khoảng bao nhiêu ngữ cảnh? Một dòng nhắc nhở (20 token)? Một đoạn văn (100 token)? Một prompt toàn hệ thống + tài liệu (hơn 2000 token)? Đây là mức cơ bản của bạn.

✅ Kiểm tra nhanh: Trong quá trình kiểm tra, bạn nhận ra rằng bạn sao chép và dán cùng 3 đoạn văn vào mọi cuộc hội thoại AI mới. Điều này cho bạn biết gì về kỹ thuật tạo ngữ cảnh hiện tại của bạn?

Đáp án: Bạn có bộ nhớ ngữ nghĩa — những sự kiện bền vững luôn luôn liên quan — nhưng bạn đang quản lý nó thủ công. Điều này nên được lưu trữ trong một file cấu hình tự động load. Bạn đã xác định được thành công đầu tiên trong việc xây dựng ngữ cảnh.

Bước 2: Thiết kế kiến trúc ngữ cảnh của bạn

Ánh xạ các phát hiện kiểm toán của bạn vào 4 lớp từ Bài học 6:

Lớp 1 (luôn được load): Vai trò của bạn, mô tả dự án, quy ước, các mô hình phản tác dụng → file cấu hình (200-500 token)
Lớp 2 (theo loại tác vụ): Thông số kỹ thuật định dạng đầu ra, ví dụ few-shot, tiêu chí chất lượng → template có thể tái sử dụng (300-800 token mỗi mẫu)
Lớp 3 (theo phiên): Mô tả tác vụ hiện tại, dữ liệu đầu vào, lịch sử hội thoại → được cung cấp mỗi lần
Lớp 4 (theo yêu cầu): Tóm tắt trước đây, bài viết cơ sở kiến thức, tài liệu tham khảo → truy xuất thủ công hoặc RAG

Tổng ngân sách ngữ cảnh của bạn nên để trống ít nhất 30-40% cửa sổ cho phản hồi và suy luận của AI.

Bước 3: Tạo file cấu hình

Đây là sản phẩm đầu ra có ROI cao nhất từ dự án cuối khóa này. Hãy viết một file cấu hình cho quy trình làm việc AI chính của bạn.

Dưới đây là một template để bạn bắt đầu:

# [Tên Dự án/Quy trình làm việc]

## Giới thiệu
[Một câu: Dự án này là gì và AI đóng vai trò gì?]

## Vai trò của tôi
[Bạn làm gì? Chuyên môn của bạn là gì?] Những quyết định nào là của bạn so với của AI?]

## Công nghệ/Công cụ
[Liệt kê các công cụ, framework, ngôn ngữ hoặc nền tảng cụ thể mà bạn sử dụng]

## Quy ước
[5-10 quy tắc mà AI luôn phải tuân theo]
- [Quy tắc 1: ví dụ: "Sử dụng chế độ nghiêm ngặt của TypeScript, không bao giờ dùng `any`"]
- [Quy tắc 2: ví dụ: "Viết ở thể chủ động, tối đa 20 từ mỗi câu"]
- [Quy tắc 3: ví dụ: "Tất cả các giá trị tiền tệ đều bằng USD với 2 chữ số thập phân"]

## KHÔNG NÊN
[3-5 điều mà AI không bao giờ nên làm]
- [Lỗi lập trình 1: ví dụ: "Không sử dụng API đã lỗi thời"]
- [Lỗi lập trình 2: ví dụ: "Không bịa đặt số liệu thống kê"]
- [Lỗi lập trình 3: ví dụ: "Không thay đổi lược đồ cơ sở dữ liệu mà không hỏi"]

## Tùy chọn đầu ra
[Theo cách bạn muốn] [AI để định dạng và gửi công việc của nó]
- [Định dạng: ví dụ: "Sử dụng markdown với tiêu đề H2 cho các phần"]
- [Độ dài: ví dụ: "Giữ câu trả lời dưới 500 từ trừ khi được yêu cầu dài hơn"]
- [Giọng văn: ví dụ: "Trực tiếp và cụ thể. Không dùng cụm từ thừa."]
📍 **Nơi dán:** Mở ChatGPT (chat.openai.com), Claude (claude.ai) hoặc Gemini (gemini.google.com) và bắt đầu một cuộc trò chuyện mới.

📋 **Cách sao chép prompt này:** Nhấp vào bất kỳ đâu bên trong khối màu xám, nhấn Cmd+A rồi Cmd+C (Mac) hoặc Ctrl+A rồi Ctrl+C (Windows). Hoặc sử dụng biểu tượng sao chép xuất hiện.

Hãy viết điều này thật sự. Ngay bây giờ. Chỉ mất 10-15 phút và sẽ giúp bạn tiết kiệm hàng giờ trong tháng tới.

✅ Kiểm tra nhanh: File cấu hình của bạn có 2.000 token. Mô hình AI chính của bạn có cửa sổ ngữ cảnh 128K. Điều này có vấn đề gì không?

Câu trả lời: Hoàn toàn không. 2.000 token chỉ chiếm khoảng 1,5% của cửa sổ 128K — hoàn toàn nằm trong giới hạn cho phép. Nhưng hãy kiểm tra xem bạn có đang bao gồm thông tin chỉ đôi khi liên quan hay không. Bất cứ điều gì chỉ áp dụng cho một số tác vụ nhất định nên được đưa vào mẫu Lớp 2, chứ không phải Lớp 1. Giữ cho Lớp 1 gọn nhẹ — chỉ những thứ mà AI luôn cần biết.

Bước 4: Xây dựng template tác vụ

Đối với 3 tác vụ định kỳ hàng đầu của bạn, hãy tạo một template có thể tái sử dụng. Mỗi template nên bao gồm:

Cấu trúc template

✏️ **Cách điền thông tin chi tiết của bạn:** Thay thế mỗi `[]` và trình giữ chỗ trong ngoặc bằng các thông tin cụ thể từ tình huống thực tế của bạn. Đầu vào mơ hồ sẽ tạo ra đầu ra mơ hồ — hãy nêu cụ thể.

👀 **Những gì bạn sẽ thấy:** Trong vòng vài giây, AI sẽ trả về một phản hồi có cấu trúc dựa trên câu hỏi ở trên. Hãy đọc kỹ và coi đó là bản nháp, không phải câu trả lời cuối cùng.

📌 **Cách sử dụng kết quả:** Lưu phản hồi vào file Notes. Chọn gợi ý có hiệu quả cao nhất và thực hiện nó trong tuần này — đừng cố gắng làm tất cả cùng một lúc.

⚠️ **Nếu kết quả không ổn:** Nếu các gợi ý có vẻ chung chung, hãy dán nội dung sau: "Hãy cụ thể hơn với ngữ cảnh thực tế của tôi. Bỏ những lời khuyên chung chung." Nếu nó bỏ qua các chi tiết quan trọng bạn đã cung cấp, hãy hỏi: "Bạn đã bỏ sót [X] trong ngữ cảnh của tôi — hãy thực hiện lại với điều đó làm ràng buộc chính."

markdown
# Nhiệm vụ: [Tên nhiệm vụ]
## Khi nào sử dụng
[Một câu mô tả khi nào template này được áp dụng]

## Bổ sung ngữ cảnh hệ thống
[Bất kỳ hướng dẫn cụ thể nào cho nhiệm vụ ngoài cấu hình cơ bản]

## Đặc tả đầu vào
[Những gì người dùng cung cấp — định dạng, các trường bắt buộc, các trường tùy chọn]

## Đặc tả đầu ra
[Định dạng chính xác của đầu ra dự kiến — cấu trúc, độ dài, kiểu]

## Ví dụ
[1-2 ví dụ ngắn gọn minh họa đầu vào → đầu ra]

## Kiểm tra chất lượng
[Cách xác minh đầu ra tốt — 3-5 tiêu chí]

Ví dụ, một template đánh giá code có thể quy định: "Tập trung vào tính chính xác > khả năng đọc hiểu > hiệu suất. Đầu vào = sự khác biệt + mô tả PR. Đầu ra = Tóm tắt, Vấn đề quan trọng, Đề xuất, Câu hỏi. Kiểm tra chất lượng: mỗi vấn đề đều trích dẫn số dòng, đề xuất bao gồm các giải pháp thay thế."

Bước 5: Thiết kế chiến lược bộ nhớ của bạn

Sử dụng framework từ Bài học 5, hãy quyết định cách thông tin được lưu giữ giữa các phiên:

Loại thông tin	Lớp bộ nhớ	Lưu trữ	Load khi nào
Quy ước dự án	Ngữ nghĩa	File cấu hình	Mỗi phiên (tự động)
Các quyết định trong quá khứ	Theo từng tập	Tóm tắt cuộc hội thoại	Khi chủ đề liên quan xuất hiện
Kiến thức chuyên ngành	Ngữ nghĩa	Các file kiến thức chuyên ngành	Theo loại nhiệm vụ
Lịch sử tác vụ	Theo từng tập	Nhật ký tóm tắt	Khi xem xét lại công việc đã làm trước đây
Tùy chọn của người dùng	Ngữ nghĩa	File cấu hình	Mỗi phiên (tự động)

Đối với hầu hết người dùng cá nhân, chiến lược quản lý bộ nhớ khá đơn giản:

File cấu hình cho mọi thứ luôn liên quan (tự động load)
Ghi chú tóm tắt cho các quyết định quan trọng (dán vào khi cần thiết)
Tài liệu tham khảo cho các nhiệm vụ chuyên biệt theo lĩnh vực (dán vào cho mỗi nhiệm vụ)

Bạn chỉ cần RAG khi kho kiến thức của bạn quá lớn để chọn lọc thủ công — thường là hơn 50 tài liệu hoặc hơn 100.000 từ tài liệu tham khảo.

Bước 6: Test và lặp lại

Hệ thống kỹ thuật tạo ngữ cảnh chưa hoàn thiện khi bạn viết nó. Nó hoàn thiện khi bạn đã test nó.

Quy trình test

Bài test 1: Test phiên mới

Mở một phiên AI hoàn toàn mới với file cấu hình đã được load. Giao cho nó một nhiệm vụ bạn đã thực hiện trước đó mà không cần cấu hình. So sánh kết quả đầu ra. Phiên bản mới có tốt hơn không? Cụ thể hơn không? Phù hợp hơn với sở thích của bạn không?

Bài test 2: Test với đồng nghiệp

Cung cấp file cấu hình và template nhiệm vụ cho một đồng nghiệp. Yêu cầu họ sử dụng nó với AI. Kết quả đầu ra có phù hợp với tiêu chuẩn của nhóm bạn không? Nếu không, điều gì còn thiếu?

Bài test 3: Kiểm tra trường hợp ngoại lệ

Hãy thử với các yêu cầu bất thường hoặc mơ hồ. File cấu hình có giúp AI đưa ra phán đoán đúng đắn không? Hay nó đoán (một cách kém chính xác) vì tình huống đó không được đề cập đến?

Bài test 4: Kiểm tra ngân sách token

Kiểm tra tổng mức sử dụng ngữ cảnh của bạn. Cấu hình hệ thống + template tác vụ + dữ liệu đầu vào + lịch sử hội thoại — liệu nó có đủ chỗ cho phản hồi của AI không? Nếu ngữ cảnh của bạn đang sử dụng hơn 70% cửa sổ, bạn cần nén lại.

✅ Kiểm tra nhanh: Bạn kiểm tra hệ thống kỹ thuật tạo ngữ cảnh mới của mình và thấy rằng nó hoạt động tốt cho 8 trên 10 tác vụ nhưng lại thất bại ở 2 trường hợp ngoại lệ. Bạn có nên thêm ngữ cảnh để bao phủ những trường hợp ngoại lệ đó không?

Câu trả lời: Có thể, nhưng hãy cẩn thận. Kiểm tra xem các trường hợp ngoại lệ có thực sự đủ phổ biến để cần ngữ cảnh luôn được load hay không. Nếu chúng hiếm khi xảy ra, hãy xử lý chúng bằng cách thêm ngữ cảnh theo từng phiên thay vì mở rộng file cấu hình của bạn. Hãy nhớ đến mô hình phản tác dụng quá tải ngữ cảnh — mỗi token trong cấu hình của bạn đều phải xứng đáng với vị trí của nó.

Những điểm chính cần ghi nhớ

Bắt đầu bằng việc kiểm tra: Xác định những gì bạn đang giải thích lại, AI thất bại ở đâu và ngữ cảnh bạn hiện đang cung cấp là gì.
Thiết kế kiến trúc của bạn theo từng lớp: Ngữ cảnh hệ thống (luôn được load), template tác vụ (theo loại tác vụ), ngữ cảnh phiên (theo cuộc hội thoại) và ngữ cảnh được truy xuất (theo yêu cầu).
File cấu hình là khoản đầu tư kỹ thuật tạo ngữ cảnh có ROI cao nhất — 30 phút viết giúp tiết kiệm hàng giờ giải thích lại.
Template tác vụ với thông số kỹ thuật đầu ra và các ví dụ few-shot giúp các tác vụ lặp lại trở nên nhất quán và đáng tin cậy.
Chiến lược ghi nhớ cho hầu hết mọi người: File cấu hình + tóm tắt cuộc hội thoại. Chỉ thêm RAG khi cơ sở kiến thức của bạn vượt quá những gì bạn có thể chọn thủ công.
Kiểm tra hệ thống của bạn: Kiểm tra phiên mới, kiểm tra đồng nghiệp, kiểm tra trường hợp ngoại lệ và kiểm tra ngân sách token.
Kỹ thuật tạo ngữ cảnh là một quá trình lặp đi lặp lại — xây dựng, kiểm tra, tinh chỉnh, lặp lại.

Thứ Năm, 21/05/2026 10:30

5 ★ 1 👨 35

Bạn nên đọc

Xác thực tài khoản!

Theo Nghị định 147/2024/ND-CP, bạn cần xác thực tài khoản trước khi sử dụng tính năng này. Chúng tôi sẽ gửi mã xác thực qua SMS hoặc Zalo tới số điện thoại mà bạn nhập dưới đây:

Số điện thoại chưa đúng định dạng!

0 Bình luận

Sắp xếp theo

Xóa Đăng nhập để Gửi

Kỹ thuật thiết kế Prompt

Cũ vẫn chất

Xem thêm

Kỹ thuật thiết kế Prompt

Giấy phép số 362/GP-BTTTT. Bộ Thông tin và Truyền thông cấp ngày 30/06/2016. Cơ quan chủ quản: CÔNG TY CỔ PHẦN MẠNG TRỰC TUYẾN META. Địa chỉ: 56 Duy Tân, Phường Cầu Giấy, Hà Nội. Điện thoại: 024 2242 6188. Email: info@meta.vn. Chịu trách nhiệm nội dung: Lê Ngọc Lam.

Xây dựng hệ thống kỹ thuật tạo ngữ cảnh của bạn

Bài tập cuối khóa: Xây dựng hệ thống kỹ thuật tạo ngữ cảnh của bạn

Bước 1: Đánh giá việc sử dụng AI hiện tại của bạn

Bước 2: Thiết kế kiến trúc ngữ cảnh của bạn

Bước 3: Tạo file cấu hình

Bước 4: Xây dựng template tác vụ

Cấu trúc template

Bước 5: Thiết kế chiến lược bộ nhớ của bạn

Bước 6: Test và lặp lại

Quy trình test

Những điểm chính cần ghi nhớ

Kết quả luyện tập

Bạn nên đọc

Xây dựng tính năng LLM cho sản xuất

Kỹ thuật tạo ngữ cảnh cho AI Agent

Cấu trúc ngữ cảnh: Thẻ XML, prompt hệ thống và các ví dụ Few-Shot

Test và đánh giá prompt

Giới hạn an toàn và bảo mật prompt

Xây dựng quy trình tự động hóa AI thực tế trong doanh nghiệp

Xây dựng thư viện prompt của bạn

RAG và Context Engineering (Kỹ thuật ngữ cảnh)

Thiết kế prompt: Kỹ năng cần thiết cho những nhà phát triển

Cũ vẫn chất

Cách khắc phục lỗi Android không kết nối với Windows qua ADB

Đáp án Wordle mới nhất hôm nay 21/05/2026

Kaspersky Antivirus bị cấm: Đây là 3 lựa chọn thay thế!

30+ Lời chúc thi tốt cho người yêu ý nghĩa và ngọt ngào, giúp người ấy có động lực, tự tin đạt kết quả tốt nhất

Cách gỡ cài đặt bất kỳ ứng dụng Android nào bằng ADB (bao gồm cả ứng dụng hệ thống và bloatware)

Trắc nghiệm ASP.NET - Phần 1

Bảng màu FF, cách viết chữ màu Free Fire

Tên FF hay cho nam, tên Free Fire ngầu cho nam

Stt kết thúc năm học, cap tổng kết năm học

7 ứng dụng Android miễn phí giúp cuộc sống dễ dàng hơn