Hướng dẫn
Cách viết lời nhắc ảnh cho AI thật sự hiệu quả

Cấu tạo của một prompt ảnh AI hiệu quả là gì?
Mọi prompt hiệu quả đều được xây dựng từ cùng những phần cơ bản, xếp lớp từ quan trọng nhất đến ít quan trọng nhất. Hãy nghĩ như đang brief cho một nhiếp ảnh gia chưa từng gặp bạn: bạn mô tả chủ thể trước, rồi tạo dựng thế giới xung quanh nó.
- Chủ thể: yếu tố quan trọng nhất. “một chú chó con Golden Retriever”, “một cái cốc cà phê bằng gốm sứ”, “một người phụ nữ ngoài 60 tuổi”
- Thuộc tính chính: những chi tiết định nghĩa khiến chủ thể trở nên cụ thể. Tuổi, biểu cảm, trang phục, chất liệu, màu sắc, tư thế.
- Bối cảnh / môi trường: nơi diễn ra. “trên một con phố ướt bóng sau mưa”, “trên mặt kệ bếp bằng đá cẩm thạch”, “trong một khu rừng thông mờ sương”
- Ánh sáng: có thể nói là đòn bẩy lớn nhất đối với cảm xúc và độ chân thực. “ánh sáng mềm từ cửa sổ”, “ánh sáng ngược giờ vàng”, “ánh sáng viền kịch tính trong studio”
- Máy ảnh, ống kính và phong cách: “chụp bằng ống kính 50mm”, “độ sâu trường ảnh nông”, “nhiếp ảnh thời trang mang phong cách tạp chí”, “kết cấu hạt phim”
- Tâm trạng: sắc thái cảm xúc. “bình yên và tĩnh lặng”, “năng động và tinh nghịch”, “u ám và mang chất điện ảnh”
- Yêu cầu kỹ thuật: độ phân giải, mức độ chi tiết và định dạng. “độ chi tiết cao”, “lấy nét sắc nét”, “4k”
Hai điều khiển nữa đi kèm với chính prompt. Một negative prompt liệt kê những điều cần tránh, chẳng hạn “mờ, thừa ngón tay, văn bản, watermark, quá bão hòa.” Tỷ lệ khung hình xác định bố cục: 1:1 cho bài đăng vuông trên mạng xã hội, 4:5 cho feed dọc, 16:9 cho phong cảnh và banner, 9:16 cho stories và reels.
Bạn không cần viết mọi lớp cho từng hình ảnh, nhưng sắp xếp theo thứ tự này giúp trình tạo ảnh AI hiểu ý định của bạn theo cùng mức ưu tiên. Nếu bạn muốn bỏ qua việc cấu trúc thủ công, Trình tạo prompt AI có thể tạo một prompt hoàn chỉnh từ một ý tưởng ngắn.
Tại sao sự cụ thể lại quan trọng hơn độ dài?
Những lời nhắc dài có vẻ đầy đủ, nhưng độ dài không đồng nghĩa với khả năng kiểm soát. Một bức tường tính từ thường tự mâu thuẫn, và mô hình sẽ trung bình hóa những xung đột đó thành một thứ mơ hồ. Những danh từ cụ thể, rõ ràng cùng vài bổ nghĩa quyết đoán sẽ điều hướng đáng tin cậy hơn nhiều.
So sánh “a beautiful amazing stunning gorgeous high quality professional photo of a nice dog” với “a wet black labrador shaking off water, mid-motion, backlit by low afternoon sun.” Câu thứ hai ngắn hơn nhưng lại cung cấp cho trình tạo ảnh AI một cảnh rõ ràng để dựng hình. Những từ tán dương mơ hồ như “beautiful” và “high quality” mô tả mong muốn của bạn, chứ không phải bức ảnh.
Một quy tắc hữu ích: mỗi từ nên thay đổi hình ảnh. Nếu việc bỏ một từ không làm thay đổi những gì bạn mong được nhìn thấy, thì có lẽ đó chỉ là từ thừa. Thay “a nice background” bằng “a blurred green park background,” và bạn đã biến một mong muốn thành một hướng dẫn.
Làm thế nào để lặp lại mà không mất kiểm soát?
Sai lầm phổ biến nhất sau khi suýt thành công là viết lại toàn bộ lời nhắc. Kết quả tiếp theo sẽ khác theo năm điểm và bạn không thể biết thay đổi nào thực sự có tác dụng. Hãy xem việc tạo lời nhắc như một thí nghiệm có kiểm soát: thay đổi một biến mỗi lần.
Nếu bố cục đã đúng nhưng ánh sáng phẳng, chỉ thay đổi phần mô tả ánh sáng. Nếu cảm xúc đã đúng nhưng trang phục của chủ thể sai, chỉ chỉnh thuộc tính đó. Giữ mọi thứ khác y hệt, bao gồm cả giá trị seed nếu công cụ của bạn hiển thị nó, để khác biệt bạn thấy chính là khác biệt bạn tạo ra.
- Vòng 1: chỉnh chủ thể và bố cục cho đúng; bỏ qua phần hoàn thiện.
- Vòng 2: điều chỉnh ánh sáng và thời điểm trong ngày.
- Vòng 3: tinh chỉnh camera, ống kính và phong cách.
- Vòng 4: điều chỉnh tâm trạng và màu sắc, rồi khóa tỷ lệ khung hình.
Cách làm theo từng giai đoạn này biến trải nghiệm khó chịu như chơi máy xèng thành một quy trình có thể lặp lại và dạy cho bất kỳ ai.
Các prompt ví dụ mạnh cho từng trường hợp sử dụng trông như thế nào?
Đây là các mẫu và khung sườn, không phải bảo đảm. Mỗi mẫu cho thấy cách cấu trúc áp dụng cho một nhiệm vụ cụ thể. Sao chép một mẫu, thay các chi tiết trong ngoặc bằng thông tin của bạn, rồi lặp lại từ đó. Kết quả thay đổi tùy công cụ và mô hình, nên hãy coi đây là điểm khởi đầu vững chắc hơn là công thức cố định.
Chân dung:
- “Ảnh chân dung cận mặt của một phụ nữ ngoài 30 tuổi, trang điểm tự nhiên, nụ cười nhẹ tự tin, mặc áo blazer màu than, ngồi trước phông nền xám trung tính, ánh sáng cửa sổ dịu tán đều từ bên trái, chụp bằng ống kính 85mm, độ sâu trường ảnh nông, chân dung công ty chuyên nghiệp, tông ấm và thân thiện, lấy nét sắc nét. Tiêu cực: bóng tối gắt, khuyết điểm trên da, chữ, watermark. Tỉ lệ khung hình 4:5.”
- “Chân dung môi trường của một đầu bếp nam mặc áo trắng, khoảng giữa 40 tuổi, khoanh tay, đứng trong bếp bận rộn bằng thép không gỉ với nền bokeh, ánh sáng tungsten ấm kèm hơi nước trong không khí, ống kính 35mm, phong cách phóng sự tạp chí, cảm xúc tự nhiên và tự hào, chi tiết cao. Tiêu cực: mờ, tay bị biến dạng. Tỉ lệ khung hình 3:2.”
Ảnh sản phẩm:
- “Chai dưỡng da bằng thủy tinh màu hổ phách với vòi bơm đen mờ, đặt chính giữa trên bề mặt bê tông bóng ướt, một đèn studio mềm rọi từ trên xuống với nền chuyển tông tinh tế, ống kính macro 100mm, phong cách e‑commerce tối giản sạch sẽ, cảm giác cao cấp và điềm tĩnh, phản chiếu rõ nét, chi tiết cao. Tiêu cực: lộn xộn, chữ, dấu vân tay, chói gắt. Tỉ lệ khung hình 1:1.”
- “Chồng ba thanh sôcôla thủ công bọc giấy kraft trên tấm ván gỗ mộc mạc, rải mảnh hạt ca cao xung quanh, ánh sáng bên ấm từ phía phải kèm bóng mềm, ống kính 50mm, độ sâu trường ảnh nông, nhiếp ảnh ẩm thực phong cách lifestyle, không khí ấm cúng và đắm chìm. Tiêu cực: trông như nhựa, quá bão hòa màu, watermark. Tỉ lệ khung hình 4:5.”
Phong cảnh và địa điểm:
- “Hồ núi phủ sương lúc bình minh, đỉnh tuyết phản chiếu trên mặt nước tĩnh lặng, một chiếc thuyền gỗ đơn lẻ gần bờ, ánh sáng giờ vàng nhẹ xuyên qua sương mù thấp, ống kính góc rộng 24mm, lấy nét sâu, cảm giác thanh bình và rộng mở, chi tiết tinh tế. Tiêu cực: người, tòa nhà, mờ, quá bão hòa màu. Tỉ lệ khung hình 16:9.”
- “Ngõ nhỏ lát đá cuội trong một thị trấn châu Âu cổ lúc chạng vạng, cửa hàng phát sáng ấm áp, đá ướt phản chiếu đèn đường màu hổ phách, mưa nhẹ, ống kính 35mm, không khí điện ảnh u ám, cảm giác hoài niệm, chi tiết cao. Tiêu cực: ôtô hiện đại, biển hiệu có chữ, phối cảnh bị méo. Tỉ lệ khung hình 16:9.”
Biên tập và phong cách sống:
- “Cặp đôi trẻ cười khi cùng nấu ăn trong một bếp hiện đại ngập nắng, mặc đồ linen thoải mái, rau củ tươi trên quầy bếp, ánh sáng tự nhiên nhẹ từ cửa sổ lớn, ống kính 35mm, phong cách biên tập lifestyle tự nhiên, không khí ấm áp và vui vẻ, tông da tự nhiên, chi tiết cao. Tiêu cực: tạo dáng cứng, mờ, chữ. Tỉ lệ khung hình 3:2.”
- “Bộ ảnh thời trang của một người mẫu mặc váy đỏ bay bổng trên mái nhà gió thổi lúc giờ vàng, đường chân trời thành phố đầy kịch tính phía sau, tóc vung chuyển trong chuyển động, ánh nắng chiếu từ sau tạo viền sáng, ống kính 70mm, phong cách tạp chí thời trang cao cấp, cảm giác táo bạo và tự tin. Tiêu cực: nhiều chi thêm, watermark, ánh sáng nhạt. Tỉ lệ khung hình 4:5.”
Mạng xã hội:
- “Flat-lay của một cốc matcha latte đá, một cuốn sổ và kính mát trên bề mặt màu hồng pastel, ánh sáng trên cao tươi sáng đều, góc nhìn từ trên 50mm, thẩm mỹ Instagram rực rỡ, tươi mới và nghịch ngợm, chi tiết sắc nét. Tiêu cực: bóng, lộn xộn, chữ. Tỉ lệ khung hình 1:1.”
- “Ảnh dọc toàn thân của một influencer streetwear tựa vào bức tường graffiti, áo hoodie oversized và giày chunky, ánh sáng ban ngày phủ mây mềm, ống kính 35mm, phong cách biên tập đô thị, cảm giác ngầu và tự nhiên, chi tiết cao. Tiêu cực: mờ, giày bị biến dạng, watermark. Tỉ lệ khung hình 9:16.”
Nếu bạn muốn bắt đầu từ một câu mô tả thay vì một chuỗi cấu trúc, Text to Photo sẽ nhận một mô tả đơn giản và lo phần hiển thị, đó là cách nhanh để kiểm tra xem chủ thể và bối cảnh đã đọc được rõ ràng trước khi bạn tinh chỉnh.
Yếu và mạnh: nâng cấp thực sự trông như thế nào?
Cách nhanh nhất để học viết prompt là xem các prompt yếu được viết lại cạnh nhau. Mỗi hàng bên dưới cho thấy vì sao phiên bản gốc hoạt động kém và cách khắc phục.
| Prompt yếu | Tại sao thiếu sót | Prompt mạnh |
|---|---|---|
| một con chó | Không có thuộc tính, không có bối cảnh, không có ánh sáng; mô hình tự sáng tạo mọi thứ | một con labrador đen ướt đang lắc nước giữa chuyển động trên bãi biển, ngược sáng bởi ánh mặt trời buổi chiều thấp, ống kính 70mm, độ sâu trường ảnh nông, cảm giác năng động |
| chân dung phụ nữ đẹp | “Đẹp” là từ mang tính chủ quan; không có độ tuổi, ánh sáng hay hướng bố cục | ảnh chân dung cận mặt của một phụ nữ ngoài 30, nụ cười nhẹ tự tin, phông nền xám trung tính, ánh sáng cửa sổ mềm từ bên trái, ống kính 85mm, chân dung chuyên nghiệp cho doanh nghiệp, 4:5 |
| sản phẩm trên nền trắng | Chung chung; không có vật liệu, ánh sáng hay ống kính cụ thể, nên trông như ảnh minh họa phẳng | chai chăm sóc da bằng thủy tinh hổ phách với vòi nhấn đen mờ, đặt chính giữa trên bê tông đánh bóng ướt, ánh sáng studio nhẹ từ trên xuống, ống kính macro 100mm, phong cách e‑commerce tối giản cao cấp, 1:1 |
| phong cảnh đẹp | Không có vị trí, thời gian trong ngày hay bố cục; kết quả là một bức ảnh tầm thường, dễ quên | hồ núi cao mờ sương lúc bình minh, đỉnh núi phủ tuyết phản chiếu trên mặt nước tĩnh lặng, ánh sáng giờ vàng xuyên qua sương mù thấp, ống kính góc rộng 24mm, không khí yên bình, 16:9 |
| ảnh thức ăn chất lượng cao, rất chi tiết, chuyên nghiệp | Tập hợp các từ mô tả chất lượng nhưng không có chủ thể hay bối cảnh cụ thể | chồng thanh sô‑cô‑la thủ công bọc giấy kraft trên một tấm ván mộc mạc, rắc hạt ca cao, ánh sáng ấm từ bên hông, ống kính 50mm, nhiếp ảnh ẩm thực phong cách sống ấm cúng, 4:5 |
| thành phố ấn tượng về đêm | Từ mô tả cảm xúc mơ hồ, không có chi tiết; ánh sáng và địa điểm để may rủi | ngõ hẹp lát đá cuội vào lúc chiều tà, cửa sổ cửa hàng phát sáng, những viên đá ướt phản chiếu ánh đèn đường vàng hổ phách, mưa nhẹ, ống kính 35mm, không khí điện ảnh u ám, 16:9 |
Những lỗi phổ biến nhất khi viết prompt là gì?
- Dồn quá nhiều từ mô tả chất lượng. “Best, amazing, ultra high quality, professional” chỉ tạo nhiễu chứ không giúp định hướng. Hãy mô tả cảnh thay vào đó.
- Tự mâu thuẫn. “Minimalist but highly detailed maximalist” buộc mô hình phải hòa giải hai mục tiêu trái ngược.
- Bỏ qua ánh sáng. Ánh sáng quyết định tính chân thực và cảm xúc hơn hầu hết các phần khác; prompt thiếu chỉ dẫn ánh sáng thường trông phẳng.
- Phớt lờ negative prompts. Nếu bạn liên tục gặp chữ phủ lên ảnh, ngón tay thừa hoặc hiện tượng quá bão hòa, hãy loại chúng ra một cách rõ ràng.
- Quên tỉ lệ khung hình. Cắt ảnh vuông cho một cảnh phong cảnh sẽ lãng phí bố cục tốt nhất của bạn; hãy đặt khung hình có chủ đích.
- Nhồi nhét quá nhiều vào một prompt. Hai mươi chi tiết cạnh tranh sẽ tạo ra hỗn loạn. Bắt đầu với phần thiết yếu và tinh chỉnh dần qua các lần lặp.
- Chủ thể mơ hồ. “A person” không cho mô hình điểm neo; hãy ghi rõ tuổi, trang phục, biểu cảm và tư thế.
Làm thế nào để tinh chỉnh kết quả mà không phải làm lại mọi thứ?
Khi một lần tạo ảnh đã đạt 90% như ý, hãy kiềm chế thôi thúc bắt đầu lại. Việc làm lại sẽ bỏ đi những phần bạn đã ưng. Thay vào đó, hãy tinh chỉnh một cách có chủ ý.
- Tách lỗi ra. Xác định chính xác chỗ sai: «tay bị méo», «ánh sáng quá lạnh», «phông nền lộn xộn».
- Chỉ chỉnh một mệnh đề. Chỉ sửa phần liên quan của prompt và sinh lại; so sánh với phiên bản trước.
- Dùng negative prompts để loại bỏ. Thêm yếu tố không mong muốn vào negative prompts của bạn thay vì viết lại toàn bộ.
- Chỉnh sửa ảnh đã hoàn thiện. Nhiều công cụ cho phép bạn sửa từng phần tử trực tiếp — thay phông nền, xóa một vật thể hoặc chỉnh ánh sáng lại — để bạn giữ được bố cục đã ưng thay vì đánh cược vào một lần tạo mới.
Chỉnh sửa có lợi hơn việc làm lại bất cứ khi nào vấn đề là cục bộ và phần còn lại của ảnh ổn. Hãy dành việc đặt lại toàn bộ prompt cho khi ý tưởng cốt lõi sai. Để có phần hướng dẫn đi sâu hơn về toàn bộ quy trình, từ prompt đầu tiên đến chỉnh sửa cuối cùng, xem AI photo generator guide.
Tóm lại, vòng lặp rất đơn giản: viết một prompt có cấu trúc, sinh ảnh, tách ra một lỗi, sửa nó bằng một chỉnh sửa hoặc thay đổi một biến duy nhất, rồi lặp lại. Kỷ luật đó là điều phân biệt giữa những trường hợp may mắn lẻ tẻ và những hình ảnh xuất sắc, nhất quán.
Sources
- 01Text-to-image model (overview) — Wikipedia (accessed 2026-06-01)
- 02Prompt engineering — Wikipedia (accessed 2026-06-01)
- 03Diffusion model — Wikipedia (accessed 2026-06-01)
Các câu hỏi thường gặp
- Công thức cơ bản cho một prompt tạo ảnh bằng AI là gì?
- Đối tượng, sau đó các thuộc tính chính, bối cảnh, ánh sáng, phong cách máy ảnh/ống kính, cảm xúc và các chỉ số kỹ thuật, sắp xếp theo thứ tự quan trọng nhất đến ít quan trọng hơn. Thêm một negative prompt riêng để loại trừ những thứ không mong muốn và đặt tỷ lệ khung hình cho bố cục.
- Prompt dài hơn có phải lúc nào cũng tốt hơn không?
- Không. Sự cụ thể quan trọng hơn độ dài. Một prompt ngắn nhưng chứa danh từ cụ thể và các từ bổ nghĩa quyết đoán thường hiệu quả hơn một prompt dài chất đầy những tính từ chung chung. Hãy nhắm vào những từ mà mỗi từ đều thay đổi hình ảnh.
- Negative prompt là gì?
- Một danh sách các yếu tố bạn muốn trình tạo ảnh AI tránh, chẳng hạn mờ, ngón tay thừa, chữ, watermark, hoặc quá bão hòa màu. Đây là cách nhanh nhất để loại bỏ các lỗi lặp lại mà không phải viết lại prompt chính.
- Tỷ lệ khung hình nào tôi nên sử dụng?
- Chọn theo nơi sẽ đăng: 1:1 cho bài vuông, 4:5 cho feed dọc và chân dung, 16:9 cho cảnh rộng và banner, 9:16 cho Stories và Reels. Đặt tỷ lệ một cách có chủ đích để bố cục của bạn không bị cắt cứng.
- Tại sao ảnh AI của tôi trông phẳng hoặc quá chung chung?
- Thường là do thiếu hoặc mô tả ánh sáng yếu và đề tài mơ hồ. Thêm mô tả ánh sáng cụ thể như ánh sáng cửa sổ mềm hoặc backlight vào giờ vàng, và mô tả các đặc điểm của đề tài, bối cảnh cùng phong cách máy ảnh hoặc ống kính.
- Làm thế nào để tinh chỉnh prompt một cách hiệu quả?
- Thay đổi một biến mỗi lần. Khóa mọi thứ còn lại, bao gồm cả seed nếu công cụ của bạn có, để bạn thấy chính xác mỗi chỉnh sửa tạo ra tác động gì. Tinh chỉnh theo giai đoạn: bố cục trước, sau đó ánh sáng, rồi phong cách và cảm xúc.
- Tôi nên tạo lại (re-roll) hay chỉnh sửa một ảnh đã hoàn thành?
- Chỉnh sửa khi vấn đề chỉ nằm ở một phần và phần còn lại đã ổn, ví dụ sửa nền, xóa một vật thể hoặc chỉnh lại ánh sáng. Re-roll chỉ khi ý tưởng cốt lõi sai. Chỉnh sửa giúp giữ nguyên bố cục bạn đã hài lòng.
- Những prompt ví dụ này có đảm bảo kết quả cụ thể không?
- Không. Chúng là các khuôn mẫu và khung tham khảo nhằm hướng tới một phong cách mô tả. Kết quả thay đổi theo công cụ, mô hình và cài đặt, nên hãy coi chúng là điểm khởi đầu mạnh và tiếp tục tinh chỉnh.
- Công cụ có thể viết prompt cho tôi không?
- Có. Trình tạo prompt AI có thể dựng khung prompt đầy đủ có cấu trúc từ một ý tưởng ngắn, và Chuyển văn bản thành ảnh cho phép bạn bắt đầu từ một câu đơn. Cả hai đều là cách tốt để thử nghiệm đề tài và bối cảnh trước khi tinh chỉnh.
- Yếu tố nào có ảnh hưởng lớn nhất đến chất lượng hình ảnh?
- Ánh sáng, tiếp theo ngay sau đó là một đề tài cụ thể. Ghi rõ nguồn sáng, hướng và thời điểm trong ngày mang lại nhiều hơn về tính hiện thực và cảm xúc so với hầu hết các mệnh đề khác trong prompt.
Được viết bởi
Đội ngũ biên tập đứng sau LaFoto viết các hướng dẫn và bài so sánh về tạo ảnh bằng AI, tuân thủ tiêu chuẩn yêu cầu trích dẫn nguồn và không bịa đặt.
Đọc tiếp
Bắt đầu sáng tạo ngay hôm nay
Tạo hình ảnh đầu tiên của bạn với trình tạo hình ảnh AI tốt nhất.
Biến một câu mô tả thành một hình ảnh chân thực như ảnh hoàn chỉnh trong vài giây — rồi tinh chỉnh từng chi tiết. Không cần cài đặt, không cần Discord, không cần GPU.
Tham gia cùng 4.200+ nhà sáng tạo đang sử dụng LaFoto