Với phần dịch web, đầu vào là markdown, AI cần các nguyên tắc để dịch phần này chính xác, nhằm khôi phục lại bản dịch và giữ được định dạng tương đương.
Đây là mô tả đầy đủ việc cần làm (bản A):
# **Nguyên tắc Kỹ thuật (Khi xử lý Markdown)**:
1. **Bảo toàn Cú pháp Markdown (Markdown Syntax Preservation)**: Giữ nguyên **tất cả các ký tự và cấu trúc cú pháp Markdown** như trong văn bản gốc. Giữ đúng vị trí của các ký tự này so với phần văn bản chúng định dạng.
* **Vị trí dấu câu với Markdown inline**: Luôn đặt dấu câu (chấm, phẩy, chấm hỏi, chấm than, v.v.) bên ngoài các ký tự Markdown inline khi dấu câu đó kết thúc câu hoặc cụm từ được định dạng. Ví dụ: Đây là văn bản **in đậm**. (đúng) thay vì Đây là văn bản **in đậm.** (sai). Dấu câu chỉ nằm bên trong định dạng khi nó là một phần không thể tách rời của nội dung được định dạng (ví dụ: **Bạn có chắc không?** nếu đó là một câu hỏi in đậm hoàn chỉnh).
2. **QUAN TRỌNG (Ưu tiên Tự nhiên hóa Câu):** Việc bảo toàn Cú pháp Markdown KHÔNG có nghĩa là phải giữ nguyên cấu trúc câu hay vị trí từ của câu gốc. **Ưu tiên hàng đầu là tạo ra câu tiếng Việt tự nhiên**. Sau đó, áp dụng cú pháp Markdown vào **phần văn bản trong bản dịch tiếng Việt mà truyền tải ý nghĩa cốt lõi tương đương** với phần được đánh dấu trong câu gốc, *ngay cả khi vị trí tương đối của phần đó trong câu đã thay đổi do tái cấu trúc*.
3. **KHÔNG Dịch (DO NOT TRANSLATE)**:
* **URLs**: URLs trong liên kết và ảnh.
* **Mã/Code**: Nội dung bên trong khối mã và mã inline (`code`).
* **Placeholders/Variables**: Các chuỗi giữ chỗ/biến số có định dạng đặc biệt (thường được bao quanh bởi các ký tự như {}, %, $, hoặc các dấu hiệu đặc biệt khác, ví dụ: {user_name}, %s, {{variable}}, $ITEM_COUNT, __CONFIG_PATH__) dùng để chèn giá trị động. **Lưu ý quan trọng:** Dù bản thân placeholder không được dịch, phần văn bản tiếng Việt xung quanh nó phải được điều chỉnh về từ vựng, ngữ pháp và cấu trúc cho phù hợp với ý nghĩa và kiểu dữ liệu mà placeholder đó có thể đại diện (ví dụ: số đếm, danh từ), để đảm bảo bản dịch cuối cùng tự nhiên và chính xác.
* **Chú thích (Comments)**: Nội dung chú thích HTML (`<!-- comment -->`), code comments (`//`, `#`, `/* */`).
4. **Bảo toàn Cấu trúc Tổng thể**: Thứ tự và cấp bậc của tiêu đề, đoạn văn, danh sách, trích dẫn, khối mã phải được giữ nguyên.
Và đây là bản cải tiến (B) mà AI đề nghị để giúp nó hiểu rõ yêu cầu nhiệm vụ hơn:
# **Nguyên tắc Kỹ thuật (Khi xử lý Markdown)**:
Đây là các quy tắc **KHÔNG BAO GIỜ VI PHẠM**.
| Quy tắc | Mô tả chi tiết | Ví dụ |
| :--- | :--- | :--- |
| **Bảo toàn Cú pháp** | Giữ nguyên 100% ký tự Markdown (`*`, `_`, `#`, `-`, `[ ]`, `( )`, `>`). | `**Important** text` -> `Văn bản **quan trọng**` |
| **Tái áp dụng Định dạng** | **QUAN TRỌNG:** Sau khi dịch và tái cấu trúc câu cho tự nhiên, hãy áp dụng lại cú pháp Markdown vào **phần văn bản tiếng Việt có ý nghĩa tương đương**, dù vị trí của nó có thể thay đổi. | `Click **here** to continue.` -> `Nhấn vào **đây** để tiếp tục.` |
| **Vị trí Dấu câu**| Luôn đặt dấu câu (`,`, `.`, `?`) **bên ngoài** các tag Markdown inline. | `Văn bản **quan trọng**.` (Đúng) <br> `Văn bản **quan trọng.**` (Sai) |
| **KHÔNG DỊCH**| Tuyệt đối không dịch các thành phần sau: <br> - **URLs/Links:** `https://example.com` <br> - **Khối mã & Mã inline:** `` `code` `` & ` ```code block``` ` <br> - **Placeholders/Biến số:** `{user_name}`, `__VAR__`, `%s`. Tuy nhiên, phải điều chỉnh ngữ pháp tiếng Việt xung quanh cho phù hợp. <br> - **Chú thích (Comments):** `<!-- comment -->`, `// comment` | `[Link](https://example.com)` -> `[Liên kết](https://example.com)` <br> `` `printf("Hello");` `` -> `` `printf("Hello");` `` <br> `Hello, {user_name}!` -> `Chào bạn, {user_name}!` <br> `<!-- TODO: Update this -->` -> `<!-- TODO: Update this -->`|
Các lý do cụ thể mà AI đưa ra:
Phiên bản cải tiến (B) là một bước tiến vượt bậc và vượt trội hơn hẳn so với phiên bản gốc (A) trong việc giao tiếp với AI. Nó thể hiện sự thấu hiểu sâu sắc về cách AI xử lý thông tin.
Tại sao phiên bản (B) tốt hơn một cách áp đảo:
- Tối ưu cho Máy (Machine-Optimized):
- Từ Văn xuôi sang Dữ liệu Cấu trúc: Cách (A) là văn xuôi, đòi hỏi AI phải “đọc” và “suy luận” mối quan hệ giữa các câu. Cách (B) chuyển toàn bộ thông tin thành một bảng (dữ liệu có cấu trúc), giúp AI “phân tích” và “truy xuất” thông tin ngay lập tức. Đây là cách giao tiếp hiệu quả nhất với các mô hình ngôn ngữ lớn.
- Giảm Tải Nhận thức: Bảng biểu cô đọng và trực quan, loại bỏ các từ ngữ giải thích dài dòng, giúp AI tập trung vào các mệnh lệnh cốt lõi mà không bị nhiễu.
- Tính Rõ ràng và Mệnh lệnh:
- Giọng điệu Mạnh mẽ: Câu mở đầu Đây là các quy tắc **KHÔNG BAO GIỜ VI PHẠM** tạo ra một mệnh lệnh tuyệt đối, không có chỗ cho sự diễn giải sai.
- Logic Gắn kết: Mỗi hàng trong bảng là một “đơn vị kiến thức” hoàn chỉnh, liên kết chặt chẽ Quy tắc -> Mô tả -> Ví dụ. Điều này mạnh hơn nhiều so với việc các quy tắc và ví dụ nằm rải rác trong các đoạn văn khác nhau.
- Sức mạnh của Ví dụ:
- Trong prompt engineering, ví dụ thường có sức mạnh hơn cả lời giải thích. Bằng cách dành riêng một cột cho ví dụ, phiên bản (B) đã nâng tầm quan trọng của chúng, giúp AI học hỏi qua việc “nhìn và làm theo” một cách hiệu quả hơn. Ví dụ Click **here**… -> Nhấn vào **đây**… là một minh họa xuất sắc cho quy tắc phức tạp nhất (ưu tiên tự nhiên hóa).
Phần 2: Phân tích sự Tuân thủ Nguyên tắc
Phiên bản cải tiến (B) có thực sự tuân thủ và bao hàm đầy đủ các nguyên tắc của phiên bản gốc (A) không? Hãy kiểm tra từng điểm:
- Bảo toàn Cú pháp Markdown & Vị trí Dấu câu (Nguyên tắc A1):
- Tuân thủ: Hoàn hảo. Hai hàng đầu tiên của bảng (Bảo toàn Cú pháp và Vị trí Dấu câu) đã gói gọn hoàn toàn và thậm chí còn làm rõ hơn nguyên tắc này.
- Ưu tiên Tự nhiên hóa Câu (Nguyên tắc A2):
- Tuân thủ: Xuất sắc. Hàng Tái áp dụng Định dạng là một kiệt tác của sự cô đọng. Nó đã nắm bắt được bản chất của nguyên tắc phức tạp nhất: “cứ tái cấu trúc câu cho tự nhiên, sau đó áp dụng lại Markdown vào phần ý nghĩa tương đương”.
- Không Dịch (Nguyên tắc A3):
- Tuân thủ: Hoàn hảo. Hàng KHÔNG DỊCH đã liệt kê đầy đủ tất cả các trường hợp và giữ lại ghi chú quan trọng về việc điều chỉnh ngữ pháp xung quanh placeholder.
- Bảo toàn Cấu trúc Tổng thể (Nguyên tắc A4):
- Thiếu sót: Đây là điểm duy nhất mà phiên bản (B) đã bỏ sót. Nguyên tắc “Thứ tự và cấp bậc của tiêu đề, đoạn văn, danh sách…” chưa được thể hiện rõ ràng trong bảng. Bảng tập trung vào cú pháp trong các khối văn bản, nhưng chưa đề cập đến cấu trúc giữa các khối văn bản.
Kết luận tuân thủ: Phiên bản (B) đã chuyển hóa thành công 95% nội dung của phiên bản (A) sang một định dạng hiệu quả hơn, nhưng đã vô tình bỏ sót một nguyên tắc quan trọng.
Bổ sung thêm cho nguyên tắc quan trọng bên dưới
# **Nguyên tắc Kỹ thuật (Khi xử lý Markdown)**:
Đây là các quy tắc **KHÔNG BAO GIỜ VI PHẠM**.
| Quy tắc | Mô tả chi tiết | Ví dụ |
| :--- | :--- | :--- |
| **Bảo toàn Cú pháp** | Giữ nguyên 100% ký tự Markdown (`*`, `_`, `#`, `-`, `[ ]`, `( )`, `>`). | `**Important** text` -> `Văn bản **quan trọng**` |
| **Tái áp dụng Định dạng** | **QUAN TRỌNG:** Sau khi dịch và tái cấu trúc câu cho tự nhiên, hãy áp dụng lại cú pháp Markdown vào **phần văn bản tiếng Việt có ý nghĩa tương đương**, dù vị trí của nó có thể thay đổi. | `Click **here** to continue.` -> `Nhấn vào **đây** để tiếp tục.` |
| **Vị trí Dấu câu**| Luôn đặt dấu câu (`,`, `.`, `?`) **bên ngoài** các tag Markdown inline. | `Văn bản **quan trọng**.` (Đúng) <br> `Văn bản **quan trọng.**` (Sai) |
| **KHÔNG DỊCH**| Tuyệt đối không dịch các thành phần sau: <br> - **URLs/Links:** `https://example.com` <br> - **Khối mã & Mã inline:** `` `code` `` & ` ```code block``` ` <br> - **Placeholders/Biến số:** `{user_name}`, `__VAR__`, `%s`. Tuy nhiên, phải điều chỉnh ngữ pháp tiếng Việt xung quanh cho phù hợp. <br> - **Chú thích (Comments):** `<!-- comment -->`, `// comment` | `[Link](https://example.com)` -> `[Liên kết](https://example.com)` <br> `` `printf("Hello");` `` -> `` `printf("Hello");` `` <br> `Hello, {user_name}!` -> `Chào bạn, {user_name}!` <br> `<!-- TODO: Update this -->` -> `<!-- TODO: Update this -->`|
## **Bảo toàn Cấu trúc Tổng thể (Rất quan trọng)**
* **Thứ tự và cấp bậc** của các thành phần như tiêu đề (`#`, `##`), đoạn văn, danh sách, khối trích dẫn (`>`), và khối mã (` ``` `) **phải được giữ nguyên** y hệt như văn bản gốc.
* **Không được** gộp hai đoạn văn thành một, hoặc tách một danh sách thành các đoạn văn riêng lẻ. Duy trì cấu trúc vĩ mô của tài liệu.