Xây dựng hệ thống kỹ thuật tạo ngữ cảnh của bạn

Bạn đã dành 7 bài học để xây dựng lý thuyết, kỹ thuật và các mô hình của kỹ thuật tạo ngữ cảnh. Giờ là lúc xây dựng một thứ gì đó thực tế.

🔄 Tóm tắt nhanh: Đây là những gì chúng ta đã học — Bài 1: Kỹ thuật viết prompt so với kỹ thuật tạo ngữ cảnh và phép ẩn dụ CPU/RAM. Bài 2: Cửa sổ ngữ cảnh như bộ nhớ làm việc, phân bổ ngân sách token, vấn đề "mất tích giữa chừng". Bài 3: 4 kỹ thuật cốt lõi (Ghi, Chọn lọc, Nén, Tách biệt). Bài 4: Cấu trúc bằng thẻ XML, prompt hệ thống và các ví dụ few-shot thực hiện. Bài 5: Hệ thống bộ nhớ - phiên, bộ nhớ dài hạn và RAG. Bài 6: Ngăn xếp ngữ cảnh agent và các file cấu hình. Bài 7: Các mô hình và phản mô hình trong thế giới thực. Bài tập cuối khóa này tích hợp tất cả những điều đó.

Bài tập cuối khóa: Xây dựng hệ thống kỹ thuật tạo ngữ cảnh của bạn

Bạn sẽ xây dựng một hệ thống kỹ thuật tạo ngữ cảnh hoàn chỉnh cho một dự án hoặc quy trình làm việc thực tế mà bạn thực sự sử dụng. Không phải là giả thuyết. Một thứ bạn sẽ triển khai vào ngày mai.

Sau khi hoàn thành bài học này, bạn sẽ có:

  • Bản đánh giá về việc sử dụng AI hiện tại của bạn
  • Sơ đồ kiến ​​trúc ngữ cảnh
  • File cấu hình hoạt động
  • Chiến lược bộ nhớ
  • Kế hoạch thử nghiệm

Hãy cùng đi từng bước.

Bước 1: Đánh giá việc sử dụng AI hiện tại của bạn

Trước khi xây dựng bất cứ điều gì, hãy xác định vị trí hiện tại của bạn. Lấy một cuốn sổ tay (hoặc một tài liệu trống) và trả lời những câu hỏi sau về tuần vừa qua:

Bạn thực hiện những tác vụ AI nào lặp đi lặp lại? Liệt kê mọi tác vụ thường xuyên lặp lại. Xem xét code. Soạn thảo email. Phân tích dữ liệu. Tóm tắt cuộc họp. Nghiên cứu. Viết nội dung. Hãy cụ thể — "viết email tiếp thị" tốt hơn là "viết".

Bạn giải thích lại điều gì trong mỗi phiên làm việc? Đây là manh mối quan trọng nhất. Mỗi thông tin bạn lặp lại trong các phiên làm việc là một mảnh ghép còn thiếu của ngữ cảnh xuyên suốt. Những nguyên nhân thường gặp:

  • Ngăn xếp công nghệ và quy ước của dự án
  • Giọng điệu thương hiệu và đối tượng
  • Thuật ngữ chuyên ngành
  • Sở thích định dạng đầu ra
  • Vai trò và trách nhiệm của bạn

AI mắc lỗi ở đâu? Liệt kê 5 lần gần nhất AI tạo ra thứ gì đó mà bạn phải chỉnh sửa hoặc thực hiện lại rất nhiều. Với mỗi trường hợp, hãy tự hỏi: Vấn đề là do khả năng (AI không thể làm điều này) hay do ngữ cảnh (AI không biết điều gì đó cần thiết)?

Hầu hết các trường hợp? Đó là do ngữ cảnh.

Ngân sách token hiện tại của bạn là bao nhiêu? Bạn đang cung cấp khoảng bao nhiêu ngữ cảnh? Một dòng nhắc nhở (20 token)? Một đoạn văn (100 token)? Một prompt toàn hệ thống + tài liệu (hơn 2000 token)? Đây là mức cơ bản của bạn.

Kiểm tra nhanh: Trong quá trình kiểm tra, bạn nhận ra rằng bạn sao chép và dán cùng 3 đoạn văn vào mọi cuộc hội thoại AI mới. Điều này cho bạn biết gì về kỹ thuật tạo ngữ cảnh hiện tại của bạn?

Đáp án: Bạn có bộ nhớ ngữ nghĩa — những sự kiện bền vững luôn luôn liên quan — nhưng bạn đang quản lý nó thủ công. Điều này nên được lưu trữ trong một file cấu hình tự động load. Bạn đã xác định được thành công đầu tiên trong việc xây dựng ngữ cảnh.

Bước 2: Thiết kế kiến trúc ngữ cảnh của bạn

Ánh xạ các phát hiện kiểm toán của bạn vào 4 lớp từ Bài học 6:

  • Lớp 1 (luôn được load): Vai trò của bạn, mô tả dự án, quy ước, các mô hình phản tác dụng → file cấu hình (200-500 token)
  • Lớp 2 (theo loại tác vụ): Thông số kỹ thuật định dạng đầu ra, ví dụ few-shot, tiêu chí chất lượng → template có thể tái sử dụng (300-800 token mỗi mẫu)
  • Lớp 3 (theo phiên): Mô tả tác vụ hiện tại, dữ liệu đầu vào, lịch sử hội thoại → được cung cấp mỗi lần
  • Lớp 4 (theo yêu cầu): Tóm tắt trước đây, bài viết cơ sở kiến ​​thức, tài liệu tham khảo → truy xuất thủ công hoặc RAG

Tổng ngân sách ngữ cảnh của bạn nên để trống ít nhất 30-40% cửa sổ cho phản hồi và suy luận của AI.

Bước 3: Tạo file cấu hình

Đây là sản phẩm đầu ra có ROI cao nhất từ ​​dự án cuối khóa này. Hãy viết một file cấu hình cho quy trình làm việc AI chính của bạn.

Dưới đây là một template để bạn bắt đầu:

# [Tên Dự án/Quy trình làm việc]

## Giới thiệu
[Một câu: Dự án này là gì và AI đóng vai trò gì?]

## Vai trò của tôi
[Bạn làm gì? Chuyên môn của bạn là gì?] Những quyết định nào là của bạn so với của AI?]

## Công nghệ/Công cụ
[Liệt kê các công cụ, framework, ngôn ngữ hoặc nền tảng cụ thể mà bạn sử dụng]

## Quy ước
[5-10 quy tắc mà AI luôn phải tuân theo]
- [Quy tắc 1: ví dụ: "Sử dụng chế độ nghiêm ngặt của TypeScript, không bao giờ dùng `any`"]
- [Quy tắc 2: ví dụ: "Viết ở thể chủ động, tối đa 20 từ mỗi câu"]
- [Quy tắc 3: ví dụ: "Tất cả các giá trị tiền tệ đều bằng USD với 2 chữ số thập phân"]

## KHÔNG NÊN
[3-5 điều mà AI không bao giờ nên làm]
- [Lỗi lập trình 1: ví dụ: "Không sử dụng API đã lỗi thời"]
- [Lỗi lập trình 2: ví dụ: "Không bịa đặt số liệu thống kê"]
- [Lỗi lập trình 3: ví dụ: "Không thay đổi lược đồ cơ sở dữ liệu mà không hỏi"]

## Tùy chọn đầu ra
[Theo cách bạn muốn] [AI để định dạng và gửi công việc của nó]
- [Định dạng: ví dụ: "Sử dụng markdown với tiêu đề H2 cho các phần"]
- [Độ dài: ví dụ: "Giữ câu trả lời dưới 500 từ trừ khi được yêu cầu dài hơn"]
- [Giọng văn: ví dụ: "Trực tiếp và cụ thể. Không dùng cụm từ thừa."]
📍 **Nơi dán:** Mở ChatGPT (chat.openai.com), Claude (claude.ai) hoặc Gemini (gemini.google.com) và bắt đầu một cuộc trò chuyện mới.

📋 **Cách sao chép prompt này:** Nhấp vào bất kỳ đâu bên trong khối màu xám, nhấn Cmd+A rồi Cmd+C (Mac) hoặc Ctrl+A rồi Ctrl+C (Windows). Hoặc sử dụng biểu tượng sao chép xuất hiện.

Hãy viết điều này thật sự. Ngay bây giờ. Chỉ mất 10-15 phút và sẽ giúp bạn tiết kiệm hàng giờ trong tháng tới.

Kiểm tra nhanh: File cấu hình của bạn có 2.000 token. Mô hình AI chính của bạn có cửa sổ ngữ cảnh 128K. Điều này có vấn đề gì không?

Câu trả lời: Hoàn toàn không. 2.000 token chỉ chiếm khoảng 1,5% của cửa sổ 128K — hoàn toàn nằm trong giới hạn cho phép. Nhưng hãy kiểm tra xem bạn có đang bao gồm thông tin chỉ đôi khi liên quan hay không. Bất cứ điều gì chỉ áp dụng cho một số tác vụ nhất định nên được đưa vào mẫu Lớp 2, chứ không phải Lớp 1. Giữ cho Lớp 1 gọn nhẹ — chỉ những thứ mà AI luôn cần biết.

Bước 4: Xây dựng template tác vụ

Đối với 3 tác vụ định kỳ hàng đầu của bạn, hãy tạo một template có thể tái sử dụng. Mỗi template nên bao gồm:

Cấu trúc template

✏️ **Cách điền thông tin chi tiết của bạn:** Thay thế mỗi `[]` và trình giữ chỗ trong ngoặc bằng các thông tin cụ thể từ tình huống thực tế của bạn. Đầu vào mơ hồ sẽ tạo ra đầu ra mơ hồ — hãy nêu cụ thể.

👀 **Những gì bạn sẽ thấy:** Trong vòng vài giây, AI sẽ trả về một phản hồi có cấu trúc dựa trên câu hỏi ở trên. Hãy đọc kỹ và coi đó là bản nháp, không phải câu trả lời cuối cùng.

📌 **Cách sử dụng kết quả:** Lưu phản hồi vào file Notes. Chọn gợi ý có hiệu quả cao nhất và thực hiện nó trong tuần này — đừng cố gắng làm tất cả cùng một lúc.

⚠️ **Nếu kết quả không ổn:** Nếu các gợi ý có vẻ chung chung, hãy dán nội dung sau: "Hãy cụ thể hơn với ngữ cảnh thực tế của tôi. Bỏ những lời khuyên chung chung." Nếu nó bỏ qua các chi tiết quan trọng bạn đã cung cấp, hãy hỏi: "Bạn đã bỏ sót [X] trong ngữ cảnh của tôi — hãy thực hiện lại với điều đó làm ràng buộc chính."

markdown
# Nhiệm vụ: [Tên nhiệm vụ]
## Khi nào sử dụng
[Một câu mô tả khi nào template này được áp dụng]

## Bổ sung ngữ cảnh hệ thống
[Bất kỳ hướng dẫn cụ thể nào cho nhiệm vụ ngoài cấu hình cơ bản]

## Đặc tả đầu vào
[Những gì người dùng cung cấp — định dạng, các trường bắt buộc, các trường tùy chọn]

## Đặc tả đầu ra
[Định dạng chính xác của đầu ra dự kiến ​​— cấu trúc, độ dài, kiểu]

## Ví dụ
[1-2 ví dụ ngắn gọn minh họa đầu vào → đầu ra]

## Kiểm tra chất lượng
[Cách xác minh đầu ra tốt — 3-5 tiêu chí]

Ví dụ, một template đánh giá code có thể quy định: "Tập trung vào tính chính xác > khả năng đọc hiểu > hiệu suất. Đầu vào = sự khác biệt + mô tả PR. Đầu ra = Tóm tắt, Vấn đề quan trọng, Đề xuất, Câu hỏi. Kiểm tra chất lượng: mỗi vấn đề đều trích dẫn số dòng, đề xuất bao gồm các giải pháp thay thế."

Bước 5: Thiết kế chiến lược bộ nhớ của bạn

Sử dụng framework từ Bài học 5, hãy quyết định cách thông tin được lưu giữ giữa các phiên:

Loại thông tinLớp bộ nhớLưu trữLoad khi nào
Quy ước dự ánNgữ nghĩaFile cấu hìnhMỗi phiên (tự động)
Các quyết định trong quá khứTheo từng tậpTóm tắt cuộc hội thoạiKhi chủ đề liên quan xuất hiện
Kiến thức chuyên ngànhNgữ nghĩaCác file kiến thức chuyên ngànhTheo loại nhiệm vụ
Lịch sử tác vụTheo từng tậpNhật ký tóm tắtKhi xem xét lại công việc đã làm trước đây
Tùy chọn của người dùngNgữ nghĩaFile cấu hìnhMỗi phiên (tự động)

Đối với hầu hết người dùng cá nhân, chiến lược quản lý bộ nhớ khá đơn giản:

  1. File cấu hình cho mọi thứ luôn liên quan (tự động load)
  2. Ghi chú tóm tắt cho các quyết định quan trọng (dán vào khi cần thiết)
  3. Tài liệu tham khảo cho các nhiệm vụ chuyên biệt theo lĩnh vực (dán vào cho mỗi nhiệm vụ)

Bạn chỉ cần RAG khi kho kiến ​​thức của bạn quá lớn để chọn lọc thủ công — thường là hơn 50 tài liệu hoặc hơn 100.000 từ tài liệu tham khảo.

Bước 6: Test và lặp lại

Hệ thống kỹ thuật tạo ngữ cảnh chưa hoàn thiện khi bạn viết nó. Nó hoàn thiện khi bạn đã test nó.

Quy trình test

Bài test 1: Test phiên mới

Mở một phiên AI hoàn toàn mới với file cấu hình đã được load. Giao cho nó một nhiệm vụ bạn đã thực hiện trước đó mà không cần cấu hình. So sánh kết quả đầu ra. Phiên bản mới có tốt hơn không? Cụ thể hơn không? Phù hợp hơn với sở thích của bạn không?

Bài test 2: Test với đồng nghiệp

Cung cấp file cấu hình và template nhiệm vụ cho một đồng nghiệp. Yêu cầu họ sử dụng nó với AI. Kết quả đầu ra có phù hợp với tiêu chuẩn của nhóm bạn không? Nếu không, điều gì còn thiếu?

Bài test 3: Kiểm tra trường hợp ngoại lệ

Hãy thử với các yêu cầu bất thường hoặc mơ hồ. File cấu hình có giúp AI đưa ra phán đoán đúng đắn không? Hay nó đoán (một cách kém chính xác) vì tình huống đó không được đề cập đến?

Bài test 4: Kiểm tra ngân sách token

Kiểm tra tổng mức sử dụng ngữ cảnh của bạn. Cấu hình hệ thống + template tác vụ + dữ liệu đầu vào + lịch sử hội thoại — liệu nó có đủ chỗ cho phản hồi của AI không? Nếu ngữ cảnh của bạn đang sử dụng hơn 70% cửa sổ, bạn cần nén lại.

Kiểm tra nhanh: Bạn kiểm tra hệ thống kỹ thuật tạo ngữ cảnh mới của mình và thấy rằng nó hoạt động tốt cho 8 trên 10 tác vụ nhưng lại thất bại ở 2 trường hợp ngoại lệ. Bạn có nên thêm ngữ cảnh để bao phủ những trường hợp ngoại lệ đó không?

Câu trả lời: Có thể, nhưng hãy cẩn thận. Kiểm tra xem các trường hợp ngoại lệ có thực sự đủ phổ biến để cần ngữ cảnh luôn được load hay không. Nếu chúng hiếm khi xảy ra, hãy xử lý chúng bằng cách thêm ngữ cảnh theo từng phiên thay vì mở rộng file cấu hình của bạn. Hãy nhớ đến mô hình phản tác dụng quá tải ngữ cảnh — mỗi token trong cấu hình của bạn đều phải xứng đáng với vị trí của nó.

Những điểm chính cần ghi nhớ

  • Bắt đầu bằng việc kiểm tra: Xác định những gì bạn đang giải thích lại, AI thất bại ở đâu và ngữ cảnh bạn hiện đang cung cấp là gì.
  • Thiết kế kiến ​​trúc của bạn theo từng lớp: Ngữ cảnh hệ thống (luôn được load), template tác vụ (theo loại tác vụ), ngữ cảnh phiên (theo cuộc hội thoại) và ngữ cảnh được truy xuất (theo yêu cầu).
  • File cấu hình là khoản đầu tư kỹ thuật tạo ngữ cảnh có ROI cao nhất — 30 phút viết giúp tiết kiệm hàng giờ giải thích lại.
  • Template tác vụ với thông số kỹ thuật đầu ra và các ví dụ few-shot giúp các tác vụ lặp lại trở nên nhất quán và đáng tin cậy.
  • Chiến lược ghi nhớ cho hầu hết mọi người: File cấu hình + tóm tắt cuộc hội thoại. Chỉ thêm RAG khi cơ sở kiến ​​thức của bạn vượt quá những gì bạn có thể chọn thủ công.
  • Kiểm tra hệ thống của bạn: Kiểm tra phiên mới, kiểm tra đồng nghiệp, kiểm tra trường hợp ngoại lệ và kiểm tra ngân sách token.
  • Kỹ thuật tạo ngữ cảnh là một quá trình lặp đi lặp lại — xây dựng, kiểm tra, tinh chỉnh, lặp lại.
  • Câu 1:

    Trong toàn bộ khóa học này, nguyên tắc quan trọng nhất của kỹ thuật tạo ngữ cảnh là gì?

    GIẢI THÍCH:

    Đây là nguyên tắc tổng quát. Mọi kỹ thuật trong khóa học đều phục vụ mục đích đó: Viết tạo ra thông tin chính xác. Chọn lọc tìm ra những gì liên quan. Nén giúp duy trì hiệu quả. Tách biệt đặt ngữ cảnh quan trọng vào nơi AI chú ý. Bộ nhớ lưu trữ thông tin giữa các phiên làm việc. Cấu trúc đặt thông tin vào đúng định dạng. Vấn đề không bao giờ là "nhiều ngữ cảnh hơn" — mà là "ngữ cảnh phù hợp". Kỹ thuật tạo ngữ cảnh không phải là tối đa hóa những gì AI biết, mà là đảm bảo nó có chính xác những gì cần thiết cho nhiệm vụ cụ thể đang thực hiện.

  • Câu 2:

    Bạn đã xây dựng một hệ thống kỹ thuật tạo ngữ cảnh cho quy trình làm việc AI của nhóm mình. Sau 2 tháng, chất lượng đầu ra bắt đầu giảm mặc dù không có gì thay đổi trong thiết lập của bạn. Bạn nên làm gì?

    GIẢI THÍCH:

    Đây là mô hình phản tác dụng 'ngữ cảnh lỗi thời' từ Bài học 7. Hai điều thay đổi theo thời gian: Dự án của bạn phát triển (các tính năng mới, quy ước thay đổi, tài liệu được cập nhật) và những mô hình AI được cập nhật (thay đổi cách chúng diễn giải các hướng dẫn). Kiểm tra ngữ cảnh thường xuyên — hàng tháng là một tần suất tốt — giúp phát hiện sự sai lệch trước khi nó làm giảm chất lượng. Kiểm tra cấu hình, cơ sở kiến ​​thức và ví dụ so với thực tế hiện tại. Kiểm tra xem các bài viết trong cơ sở kiến ​​thức, file cấu hình và ví dụ có còn phản ánh thực tế hiện tại hay không. Các mô hình AI được cập nhật, những dự án phát triển và ngữ cảnh chính xác cách đây 2 tháng giờ có thể chứa thông tin lỗi thời

  • Câu 3:

    Hệ thống kỹ thuật tạo ngữ cảnh của bạn bao gồm một prompt hệ thống, một file CLAUDE.md, một cơ sở kiến ​​thức với 200 tài liệu và các ví dụ few-shot. Một đồng nghiệp hỏi: 'Làm thế nào để tôi biết liệu điều này có hoạt động hay không?' Cách tốt nhất để đánh giá là gì?

    GIẢI THÍCH:

    Kỹ thuật tạo ngữ cảnh là thực nghiệm — bạn kiểm tra nó bằng cách đo lường chất lượng đầu ra. Chạy cùng một tác vụ có và không có hệ thống ngữ cảnh của bạn, sau đó so sánh. Các chỉ số chính: AI có tuân theo những quy ước của bạn không? Câu trả lời có chính xác không? Chất lượng có nhất quán giữa các phiên không? Một cửa sổ ngữ cảnh đầy không có ý nghĩa gì nếu nội dung sai, và việc hỏi AI 'bạn có hiểu không?' luôn nhận được câu trả lời là có. Đo lường độ chính xác, tính nhất quán và liệu đầu ra có tuân theo các quy ước của bạn hay không. Nếu hệ thống ngữ cảnh liên tục tạo ra kết quả tốt hơn, thì nó đang hoạt động

  • Câu 4:

    Bạn đang kiểm tra việc sử dụng AI của mình và phát hiện ra rằng bạn phải giải thích lại các tiêu chuẩn lập trình trong mỗi phiên trò chuyện mới. Giải pháp kỹ thuật tạo ngữ cảnh nào giải quyết được vấn đề này?

    GIẢI THÍCH:

    Việc giải thích lại lặp đi lặp lại là triệu chứng điển hình của việc thiếu ngữ cảnh cố định. Một file cấu hình là bộ nhớ ngữ nghĩa (Bài học 5) được load dưới dạng ngữ cảnh hệ thống Lớp 1 (Bài học 6). Bạn viết nó một lần, và mọi phiên trong tương lai đều bắt đầu với kiến ​​thức đó. 30 phút bạn dành để viết nó sẽ tiết kiệm hàng giờ giải thích lại trong những tuần tiếp theo. Đây là bộ nhớ ngữ nghĩa giúp loại bỏ việc giải thích lại lặp đi lặp lại giữa các phiên

Thứ Năm, 21/05/2026 10:30
51 👨 35
Xác thực tài khoản!

Theo Nghị định 147/2024/ND-CP, bạn cần xác thực tài khoản trước khi sử dụng tính năng này. Chúng tôi sẽ gửi mã xác thực qua SMS hoặc Zalo tới số điện thoại mà bạn nhập dưới đây:

Số điện thoại chưa đúng định dạng!
Số điện thoại này đã được xác thực!
Bạn có thể dùng Sđt này đăng nhập tại đây!
Lỗi gửi SMS, liên hệ Admin
0 Bình luận
Sắp xếp theo
    ❖ Kỹ thuật thiết kế Prompt