跳至内容
LaFoto

指南

如何撰写真正有效的 AI 照片提示词

一个强有力的 AI 照片提示会按重要性顺序指明四样东西:主体、场景、光线和风格。先说明图像的主体是谁或是什么,然后描述它所在的环境、光照方式,以及视觉处理(相机、镜头、氛围、色彩)。在末尾加入如分辨率或长宽比等技术限定词,并使用负面提示来排除不想要的元素。公式如下:[主体] + [关键属性] + [场景/环境] + [光线] + [相机/镜头/风格] + [氛围] + [技术限定词],并另附一个负面提示。具体性胜过长度:十个精确的词通常胜过五十个模糊的词,因为每一个具体细节都会把 AI 图像生成器引向你的意图,而不是它的平均猜测。当结果接近但不正确时,一次只更改一个变量,这样你就能看出每次修改的效果。记住你并非总要重新生成,你可以编辑已完成的照片来修正单个元素。这就是全部技巧,接下来的指南会通过可复制的示例展示其具体应用。
作者 LaFoto 编辑团队

10 分钟阅读
一个用于表现 AI 照片提示的示意性肖像构图

强效 AI 照片提示的构成是什么?

每个有效的提示都由相同的部分构成,按重要性从高到低分层。把它想象成在向一位从未见过你的摄影师简述:你先描述主体,然后围绕它构建场景。

  1. 主体:最重要的元素。“一只金毛寻回犬幼崽”,“一个陶瓷咖啡杯”,“一位60多岁的女性。”
  2. 关键属性:使主体具体化的关键细节。年龄、表情、服装、材质、颜色、姿势。
  3. 场景 / 环境:发生的地点。“在被雨水打湿的城市街道上”,“在大理石厨房台面上”,“在薄雾笼罩的松林中。”
  4. 光线:可以说是影响情绪和真实感的最大杠杆。“柔和的窗光”,“黄金时刻的背光”,“戏剧性的工作室轮廓光。”
  5. 相机、镜头与风格:“使用50mm镜头拍摄”,“浅景深”,“社论式时尚摄影”,“胶片颗粒感。”
  6. 情绪:情感基调。“宁静安详”,“充满活力且俏皮”,“情绪化且具有电影感。”
  7. 技术限定:分辨率、细节与格式。“高细节”,“清晰对焦”,“4k。”

还有两个控制项与提示本身并列。负面提示列出要避免的内容,例如“模糊、多余的手指、文本、水印、过度饱和。” 纵横比设定画面:1:1 用于方形社交贴,4:5 用于竖向信息流,16:9 用于风景和横幅,9:16 用于故事和短视频。

你不必为每张图片写出每一层,但按这种顺序排列能让 AI 照片生成器以与你相同的优先级读懂你的意图。如果你想跳过手动结构化,AI 提示生成器可以根据一个简短想法搭建出完整的提示。

为什么具体胜过冗长?

冗长的提示看起来全面,但长度并不等于可控。形容词堆砌常常互相矛盾,模型会把冲突平均化成模糊的结果。具体、明确的名词和少量果断的修饰词更能可靠地引导生成。

比较 “a beautiful amazing stunning gorgeous high quality professional photo of a nice dog” 和 “a wet black labrador shaking off water, mid-motion, backlit by low afternoon sun.”。后者更短,却为 AI 图像生成器提供了明确的场景可供构建。像 “beautiful” 和 “high quality” 这样的模糊最高级词描述的是你的期望,而不是图片。

一个有用的规则:每个词都应该改变图像。如果删掉一个词并不会改变你期望看到的内容,那它很可能只是填充。把 “a nice background” 替换为 “a blurred green park background”,你就把一个愿望换成了一个方向。

如何在迭代时不失去控制?

在接近理想结果但未完全命中的情况下,最常见的错误是重写整个提示。接着下一次的结果在五个方面都会不同,你无法分辨哪个改动起了作用。把提示调整当作一次受控实验:每次只改变一个变量。

如果构图没问题但光线平淡,只修改与光线相关的部分。若氛围合适但主体的服装不对,只编辑那个属性。其余所有内容保持完全相同,包括你的随机种子(如果你的工具支持的话),这样你看到的差异就是你所做的改变。

  • 第1轮:把主体和构图调整到位;不必追求润色。
  • 第2轮:调整光线和一天中的时间。
  • 第3轮:细化相机、镜头与风格。
  • 第4轮:微调氛围和色彩,然后锁定长宽比。

这种分阶段的方法能把令人沮丧的老虎机式体验变成一种可复制的流程,任何人都能学会。

按使用场景,优秀的示例提示词是什么样的?

这些是模板和框架,而非保证。每个示例展示了提示词的结构如何应用到特定任务。复制其中一个,把方括号里的细节替换为你自己的内容,然后从那里迭代。不同工具和模型的结果会有所差异,因此把这些视为很好的起点,而不是固定的配方。

肖像摄影:

  • “30多岁女性的头像照,自然妆容,温和自信的微笑,身穿炭灰色西装外套,坐在中性灰背景前,左侧柔和漫射的窗光,从85mm镜头拍摄,浅景深,专业企业肖像,温暖亲切的氛围,焦点清晰。排除:强烈阴影、瑕疵、文字、水印。纵横比 4:5。”
  • “白色厨师服的中年男厨师的环境人像,四十多岁,双臂交叉,站在繁忙的不锈钢厨房中,背景有散景,暖色钨丝灯光并有蒸汽弥漫,35mm镜头,纪实社论风格,抓拍且自豪的氛围,高细节。排除:模糊、手部畸形。纵横比 3:2。”

产品摄影:

  • “带哑光黑色按压喷嘴的琥珀色玻璃护肤瓶,置于湿润的抛光混凝土地面中央,单一柔和的俯光工作室灯,背景有细微渐变,100mm微距镜头,干净极简的电商风格,高端而宁静的氛围,清晰反光,高细节。排除:杂乱、文字、指纹、强烈眩光。纵横比 1:1。”
  • “放在质朴木板上的三块手工巧克力,牛皮纸包装,周围散落可可碎粒,右侧暖色侧光伴随柔和阴影,50mm镜头,浅景深,生活方式美食摄影,舒适且放纵的氛围。排除:塑料感、过度饱和、水印。纵横比 4:5。”

风景与场所:

  • “日出时分的薄雾高山湖泊,白雪覆盖的山峰在静止的湖水中倒映,湖边有一只孤独的木划艇,金色时刻的柔光穿透低雾,广角24mm镜头,深景深,宁静开阔的氛围,细节精细。排除:人物、建筑、模糊、过度饱和。纵横比 16:9。”
  • “黄昏时分老欧洲小镇的一条狭窄鹅卵石巷道,温暖发光的商店橱窗,湿石反射着琥珀色路灯,细雨,35mm镜头,电影感的情绪氛围,怀旧的基调,高细节。排除:现代汽车、文字标牌、透视畸变。纵横比 16:9。”

社论与生活方式:

  • “年轻情侣在阳光充足的现代厨房中一起做饭时欢笑,穿着休闲亚麻服,操作台上有新鲜蔬菜,大窗户带来柔和自然的日光,35mm镜头,抓拍的生活方式社论风格,温暖且愉悦的氛围,自然的肤色,高细节。排除:僵硬摆拍、模糊、文字。纵横比 3:2。”
  • “一位模特身着飘逸红裙,在黄昏有风的屋顶上拍摄的时尚社论,背后是戏剧性的城市天际线,头发被风吹起,低角度的逆光产生轮廓光,70mm镜头,高级时尚杂志风格,大胆自信的氛围。排除:多余肢体、水印、暗淡光线。纵横比 4:5。”

社交媒体:

  • “平铺拍摄的冰抹茶拿铁、一只笔记本和太阳镜,摆放在粉彩粉色背景上,明亮均匀的顶光,50mm俯拍视角,充满活力的时尚 Instagram 美学,清新俏皮的氛围,细节清晰。排除:阴影、杂乱、文字。纵横比 1:1。”
  • “街头时尚影响者倚靠在涂鸦墙上的纵向全身照,宽松连帽衫和厚底球鞋,柔和的阴天日光,35mm镜头,都市社论风格,酷炫且不费力的氛围,高细节。排除:模糊、鞋子畸形、水印。纵横比 9:16。”

如果你更愿意从一句话开始而不是结构化的字符串,“文本转照片”会将简单的描述渲染成照片,这是一种快速测试你的主体和场景在添加润色前是否清晰表达的方法。

弱提示与强提示:升级到底是什么样子?

学习如何写提示最快的方法是并排查看弱提示的改写。下面每一行展示了原始提示表现欠佳的原因以及如何修正。

弱提示为何不足强提示
一只狗没有属性、没有场景、没有光线;模型会凭空臆断一切在海滩上正在甩水的湿漉漉黑色拉布拉多,背光于低角度午后阳光,70mm 镜头,浅景深,充满活力的氛围
美丽女性肖像“Beautiful”是主观性的无实质内容;没有说明年龄、光线或构图方向三十多岁女性的头肩特写,温和而自信的微笑,中性灰背景,来自左侧的柔和窗光,85mm 镜头,专业企业肖像,4:5
白底产品照片过于通用;没有材质、光线或镜头说明,结果看起来像平面的图库剪贴画琥珀色玻璃护肤瓶,配哑光黑泵头,置中于湿润的抛光混凝土上,自上而下的柔和棚拍光,100mm 微距镜头,高端极简电商风格,1:1
漂亮风景没有地点、时间或构图信息;结果平淡、乏味,难以让人记住日出时雾气缭绕的高山湖泊,雪峰映在平静的水面,低雾中的黄金时刻光线,24mm 广角镜头,宁静氛围,16:9
高质量美食照片,细节丰富,专业风格堆砌的优质词汇却没有具体的主体或场景数块手工巧克力条用牛皮纸包裹堆放在质朴的木板上,散落的可可碎粒,温暖的侧光,50mm 镜头,温馨的生活方式美食摄影,4:5
酷炫夜景城市模糊的情绪词,没有具体细节;光线和地点由模型随意决定黄昏时分狭窄的鹅卵石小巷,发光的店窗,潮湿的石板反射着琥珀色街灯,细雨,35mm 镜头,电影化的情绪氛围,16:9

最常见的提示词错误有哪些?

  • 堆砌质量类词语。“最佳、惊艳、超高质量、专业”会增加噪音,而不是提供方向。请改为描述场景。
  • 自相矛盾。“极简但又高度细节化的极繁”会迫使模型在两个相反目标之间折中。
  • 忽视光线。光线比几乎任何其他描述更能决定真实感与氛围;没有光线描述的提示词往往显得平淡。
  • 忽视反向提示。若你持续出现文字覆盖、多余手指或过度饱和等问题,就要明确排除它们。
  • 忘记设定宽高比。对风景场景使用正方形裁切会浪费最佳构图;要有目的地设定画面比例。
  • 在一个提示词里塞太多内容。二十个互相竞争的细节会造成混乱。先以要点为主,通过迭代逐步加入精确要求。
  • 主题模糊。“一个人”无法为模型提供锚点;请具体说明年龄、服装、表情和姿势。

如何在不全部重抽的情况下完善结果?

当生成结果已经达到90%时,别急着重来。重抽会丢掉你喜欢的部分。相反,要有目的地精修。

  • 定位瑕疵。准确说出问题是什么:“手部变形”、“光线偏冷”、“背景杂乱”。
  • 只改动一处描述。只编辑提示词中相关的部分并重新生成;然后与之前的版本对比。
  • 使用负面提示来排除。把不想要的元素加入负面提示,而不是改写全部提示。
  • 编辑已生成的照片。许多工具允许你直接修复单个元素,比如更换背景、移除物体或重新打光,这样你就能保留已经满意的构图,而不是冒险重新生成。

当问题是局部性的而图像其余部分都不错时,编辑远胜于重抽。只有在核心概念错误时才重写整个提示。要了解从首次提示到最终编辑的完整工作流程的更深入演示,请参阅 AI 照片生成器指南。

整体流程很简单:撰写结构化提示,生成,定位一个瑕疵,通过编辑或单变量修改修复,重复。正是这种纪律性将侥幸的一次成功与稳定产出优秀图片区分开来。

Sources

  1. 01Text-to-image model (overview)Wikipedia (accessed 2026-06-01)
  2. 02Prompt engineeringWikipedia (accessed 2026-06-01)
  3. 03Diffusion modelWikipedia (accessed 2026-06-01)

常见问题

AI 照片提示词的基本公式是什么?
先写主体,然后是关键属性、场景、光线、相机/镜头/风格、氛围,以及技术限定词,按重要性从高到低排列。为要排除的内容添加单独的负面提示词,并设置画面的长宽比。
更长的提示词总是更好吗?
不。具体性比长度更重要。由具体名词和明确修饰词组成的短提示词,通常胜过堆满模糊夸张语的长提示。目标是使用每个词都能改变图像的词语。
什么是负面提示词?
一份你希望 AI 图像生成器避免的元素列表,例如模糊、多余的手指、文字、水印或过度饱和。它是不重写主提示词就能最快去除常见问题的方法。
我应该使用什么长宽比?
把它与发布目的匹配:1:1 用于方形帖子,4:5 用于纵向信息流和人像,16:9 用于风景和横幅,9:16 用于 Stories 和 Reels。刻意设置长宽比,以免构图被尴尬裁切。
为什么我的 AI 照片看起来平淡或千篇一律?
通常是因为缺少或弱化了关于光线的描述,以及主体描述模糊。补充具体的光源,比如柔和的窗外光或金色时刻的逆光,并描述主体的特征、场景,以及相机或镜头的风格。
如何有效地迭代提示词?
一次只更改一个变量。把其它所有要素锁定——如果工具支持 seed(种子),也一并锁定——这样你才能准确看到每次修改的效果。分阶段细化:先构图,然后光线,再风格,最后氛围。
我应该重新生成还是编辑已完成的图片?
当问题是局部且其它部分都没问题时就编辑,例如修复背景、移除某个物体或重新照明。只有当核心概念出错时才重新生成。编辑可以保留你已经喜欢的构图。
这些示例提示词能保证得到特定结果吗?
不能。它们只是旨在引导到某种外观的模板和框架。输出会因工具、模型和设置而异,所以把它们当作有力的起点,然后再调整完善。
工具能为我写提示词吗?
能。AI Prompt Generator 可以从简短想法搭建完整的结构化提示词,而 Text to Photo 允许你从一句普通句子开始。在添加润色之前,两者都是测试主体和场景的好方法。
影响图像质量的单一最大杠杆是什么?
光线,其次是明确的主体。说明光源、方向和一天中的时段,比提示词中几乎任何其它条款都更能提升真实感和氛围。

撰稿

LaFoto 编辑团队

LaFoto 背后的编辑团队撰写关于 AI 照片生成的指南与对比评测,遵循有明确来源且禁止捏造的标准。

继续阅读

今天就开始创作

用最出色的 AI 图像生成器生成你的第一张图像。

将一句话在数秒内变成完成的、逼真的照片级图像——然后细化每一个细节。无需设置、无需 Discord、无需 GPU。

加入 4,200+ 位使用 LaFoto 的创作者