一、为什么同样的工具,别人出大片,你出垃圾片?
我们先看一组真实对比。
案例 A:菜鸟提示词
提示词:
一个女孩在海边
生成结果:你大概率得到的是——一个女孩呆呆地站在海边,构图普通、光线平淡、画面像家庭录像。
案例 B:高手提示词
提示词:
傍晚的地中海海岸,一个穿白色长裙的金发女孩赤脚走在湿润的沙滩上,海风吹起她的裙摆和头发。镜头从侧面跟随她缓慢移动,夕阳的金色余晖透过头发,背景是渐变的紫粉色天空和远处的小帆船。画面唯美、电影感、35mm 胶片质感。
生成结果:你大概率得到的是——电影《爱在黄昏破晓时》同款画面,光影、色彩、构图都很高级。
两个提示词的区别在哪?
不是字数。是信息量。
第一条提示词,你只告诉了 AI 两件事:
- 主体:女孩
- 场景:海边
AI 只能"自己脑补"剩下的 95%——什么样的女孩?穿什么?海边什么时候?什么角度?什么光线?什么风格?AI 脑补出来的东西,自然平庸。
第二条提示词,你告诉了 AI 整整 12 件事:
- 时间:傍晚
- 地点:地中海海岸
- 主体:金发女孩
- 服装:白色长裙
- 状态:赤脚、走在沙滩
- 环境互动:海风吹起裙摆和头发
- 镜头:侧面跟随、缓慢移动
- 光线:夕阳金色余晖
- 颜色:紫粉色天空
- 背景元素:远处帆船
- 风格:电影感
- 质感:35mm 胶片
AI 知道得越多,"自己脑补"的部分越少,结果就越接近你想要的样子。
写视频提示词的核心原则就一句话:你说得越具体,AI 画得越准确。
二、视频提示词的"七要素"
把上面那条高手提示词拆开,你会发现它其实有一个通用结构。这就是本章要教你的核心:
视频提示词 = 主体 + 动作 + 场景 + 镜头 + 光影 + 风格 + 声音
我们一个一个讲。
要素 1:主体(Subject)—— 画面里的"主角"
回答:画面里是谁/什么?
| 写法 | 优劣 |
|---|---|
| 一个人 | ❌ 太模糊 |
| 一个女孩 | ⚠️ 还是模糊 |
| 一个 25 岁的金发女孩 | ✅ 具体 |
| 一个穿白色长裙、赤脚、长发飘飘的 25 岁金发女孩 | ✅✅ 非常具体 |
主体描述要点:
- 种类:人、动物、物品、自然景物。
- 属性:年龄、性别、品种、颜色、大小。
- 外观:穿着、发型、表情、神态。
- 数量:1 个、2 个、3 个、一群。
反例:
- ❌ "一些人在跳舞" —— "一些"是几个?什么人?什么舞?
- ✅ "三个穿汉服的年轻女孩在月光下跳古典舞"
要素 2:动作(Action)—— 主角"在干什么"
回答:主角在做什么?发生了什么?
| 写法 | 优劣 |
|---|---|
| 一只猫 | ❌ 没动作(视频是动的,没动作就和图片差不多) |
| 一只猫坐着 | ⚠️ 有动作但太弱 |
| 一只猫跳起来抓蝴蝶 | ✅ 动作明确 |
| 一只橘猫从沙发上一跃而起,伸出爪子去抓飞过的蝴蝶 | ✅✅ 动作生动具体 |
动作描述要点:
- 视频和图片最大的区别就是"有运动"——一定要写动作。
- 动作可以是人物动作(走、跑、跳、转身、微笑)。
- 也可以是环境动作(云在飘、水在流、雪在下、风吹过)。
- 越具体越好:从"走"到"轻盈地走"到"踩着碎步走"。
反例:
- ❌ "一个人在公园" —— 在公园干嘛?站着?走着?躺着?
- ✅ "一个穿运动装的男人在公园林间小路上慢跑,呼气在冷空气里成白雾"
要素 3:场景(Scene)—— 在哪、什么时候、天气怎样
回答:在哪里?什么时候?什么环境?
| 维度 | 例子 |
|---|---|
| 地点 | 地中海海边、北京胡同、东京涩谷、家中客厅、教室、机场 |
| 时间 | 清晨、正午、黄昏、深夜、午后、凌晨 5 点 |
| 季节 | 春天、夏天、秋天、冬天 |
| 天气 | 晴天、雨天、雪天、雾天、阴天 |
| 环境元素 | 远处的山、地上的落叶、墙上的涂鸦、桌上的咖啡 |
反例:
- ❌ "在外面" —— 哪个外面?
- ✅ "深秋傍晚的北京胡同,地上铺满金黄落叶,远处传来鸽哨声"
要素 4:镜头(Camera)—— 镜头怎么动、构图怎么样
这一点是最容易被新手忽略,但对效果影响最大的。
镜头描述包括两件事:景别(拍多远)+ 运动(镜头怎么动)。
景别(拍多远)
| 景别 | 含义 | 用法举例 |
|---|---|---|
| 特写 | 只拍局部(一只眼睛、一双手) | 表达情感、细节 |
| 近景 | 头部到胸部 | 对话、表情 |
| 中景 | 头到腰 | 一般人物拍摄 |
| 全景 | 整个人 | 展现动作 |
| 远景 | 人物在大场景里 | 展现环境氛围 |
| 大远景 | 鸟瞰、航拍 | 史诗感、震撼感 |
镜头运动
| 运动 | 含义 |
|---|---|
| 推(推进、推近) | 镜头向前移动(拉近主体) |
| 拉(拉远) | 镜头向后移动(拉远) |
| 摇(pan) | 镜头不动,摇向左/右 |
| 移(trucking) | 镜头平行移动 |
| 跟(跟随) | 镜头跟着主体动 |
| 升降(crane) | 镜头从低到高(或反之) |
| 环绕(orbit) | 镜头围绕主体转一圈 |
| 手持 | 模拟手持的微微晃动感 |
| 航拍 | 从空中俯视 |
| 第一人称视角 | 像主角的眼睛在看 |
例子:
- "镜头从特写开始,缓慢拉远到全景,展现出辽阔的草原" —— 强调"渺小感"。
- "镜头紧紧跟随奔跑的少年,手持感的轻微晃动" —— 强调"代入感"。
- "无人机航拍,从城市上空缓慢俯冲" —— 强调"震撼感"。
要素 5:光影(Lighting)—— 光从哪来、什么颜色、什么气氛
光影直接决定了画面"高级"还是"廉价"。
| 描述维度 | 例子 |
|---|---|
| 光源方向 | 顶光(正上方)、侧光(侧面)、逆光(从主体后面来)、底光(从下往上)、自然光、室内灯光 |
| 光线性质 | 柔和、强烈、刺眼、朦胧、漫射、聚焦 |
| 色温 | 暖光(金黄色)、冷光(蓝白色)、霓虹色、烛光(橙红色) |
| 氛围 | 温暖、清冷、神秘、浪漫、紧张、压抑 |
| 特效光 | 丁达尔光(光柱)、镜头光晕、烛火、月光、霓虹反射 |
例子:
- "金色的夕阳从背后照射,形成温暖的逆光,主体边缘有金色光环"
- "霓虹灯的粉色和蓝色交叠在主角脸上"
- "顶光强烈,主体的影子在地面拉得很长"
要素 6:风格(Style)—— 整体美学和情绪
| 风格类型 | 例子 |
|---|---|
| 影视风格 | 电影感、纪录片风、好莱坞大片、日剧、韩剧、宫崎骏、王家卫风 |
| 画面质感 | 35mm 胶片、超清写实、油画感、水彩感、铅笔画、像素风 |
| 年代感 | 复古 80 年代、未来感、赛博朋克、蒸汽朋克、文艺复兴 |
| 色调 | 高饱和、低饱和、单色、撞色、莫兰迪色 |
| 情绪基调 | 治愈、忧郁、热血、紧张、悬疑、浪漫 |
例子:
- "宫崎骏动画风格、温暖治愈、轻盈梦幻"
- "赛博朋克 2077 风格、霓虹紫红、科幻末世感"
- "王家卫电影风格、低饱和、慢镜头、情感张力"
要素 7:声音(Sound)—— 环境声、音乐、对白
注意:不是所有 AI 视频工具都支持"生成声音"。Sora 2、Veo 3 自带音频生成;可灵、即梦等大多数工具默认不带声音,但你可以在剪映里后期加声音。
如果工具支持音频生成,可以描述:
- 环境音:海浪声、雨声、风声、城市嘈杂声、林间鸟鸣
- 音乐:钢琴轻柔旋律、激昂电吉他、电子节拍
- 对白:人物说"早上好"
- 音效:脚步声、关门声、爆炸声
例子:
- "背景声:海浪声、远处海鸥叫声,配以钢琴轻柔旋律"
三、把七要素套到一起:万能公式
记不住七要素?给你一个万能公式:
[场景时间地点] + [主体外观] + [动作] + [镜头景别+运动] + [光影] + [风格]
举例填空:
| 要素 | 你填的内容 |
|---|---|
| 场景时间地点 | 春日清晨的北京胡同 |
| 主体外观 | 一个穿米色风衣的年轻女孩 |
| 动作 | 慢慢推开木门,迎面阳光照来 |
| 镜头景别+运动 | 中景,镜头缓慢推进 |
| 光影 | 柔和的逆光,金色阳光透过门缝 |
| 风格 | 王家卫电影风、低饱和、文艺感 |
拼起来:
春日清晨的北京胡同,一个穿米色风衣的年轻女孩慢慢推开木门,迎面阳光照来。中景,镜头缓慢推进,柔和的逆光,金色阳光透过门缝。王家卫电影风、低饱和、文艺感。
直接复制到即梦或可灵,大概率出片。
四、10 个"差→好"对照案例
这是新手最该看的部分。每个案例展示同一个想法的"两版提示词"——左边是你可能写的,右边是更好的写法。
案例 1:宠物视频
| 差 | 好 |
|---|---|
| 一只可爱的猫 | 一只蓝色短毛猫趴在窗台上,看着窗外飘落的樱花,轻轻眨眼。午后阳光透过窗户洒在它身上,毛发微微闪光。镜头从侧面缓慢推近,画面温馨治愈,宫崎骏画风。 |
案例 2:风景视频
| 差 | 好 |
|---|---|
| 美丽的山脉 | 清晨的喜马拉雅山脉,晨雾在山谷中缓慢流动,第一缕金色的阳光照亮雪峰。航拍镜头从云海中缓慢飞过,展现壮丽的山峰群。画面史诗感、Discovery 纪录片风格。 |
案例 3:人物特写
| 差 | 好 |
|---|---|
| 一个女孩笑了 | 一个 22 岁的东方女孩,温柔地笑了一下,眼睛微微弯起。近景特写,柔和的窗光从侧面照来,背景虚化。画面像日剧《情书》的氛围,35mm 胶片质感。 |
案例 4:城市夜景
| 差 | 好 |
|---|---|
| 城市的夜晚 | 上海外滩深夜,黄浦江两岸高楼霓虹闪烁,江面倒映着东方明珠的灯光。无人机镜头从浦西缓慢平移到浦东,整个画面充满都市感和繁华感。赛博朋克色调,紫粉色霓虹氛围。 |
案例 5:美食视频
| 差 | 好 |
|---|---|
| 一碗面条 | 木质桌面上的一碗热气腾腾的兰州牛肉拉面,红色的辣椒油浮在汤面上,绿色的香菜点缀其中。镜头从俯视角度缓慢旋转,蒸汽袅袅升起。画面色彩饱和、食欲感强、商业广告级质感。 |
案例 6:运动视频
| 差 | 好 |
|---|---|
| 有人在跑步 | 清晨 6 点的城市街道,一个穿黑色运动装的男人在晨光中慢跑,呼气在冷空气中变成白雾。镜头从低角度跟随,背景是模糊的城市建筑。画面有 Nike 广告的运动感和热血感。 |
案例 7:温馨家庭
| 差 | 好 |
|---|---|
| 一家人在家里 | 周日早晨的家庭厨房,一对年轻夫妇和 5 岁的女儿一起做煎蛋早餐,女儿坐在父亲肩上看母亲翻锅。阳光从窗户洒进来,画面温暖。中景固定镜头,画面温馨治愈,像家庭生活类广告。 |
案例 8:科幻场景
| 差 | 好 |
|---|---|
| 一艘宇宙飞船 | 浩瀚的宇宙深空,一艘银色的星际飞船缓慢飞过,背景是色彩斑斓的星云和远处的双子星。镜头从飞船尾部缓慢拉远,展现飞船的渺小。画面如《星际穿越》般史诗壮丽,超清电影质感。 |
案例 9:抒情慢镜头
| 差 | 好 |
|---|---|
| 雨天的窗户 | 秋日午后,窗户上的雨珠缓慢滚落,玻璃外的城市街道被雨水模糊。慢镜头特写雨珠滚落的过程,背景是柔和的暖色光晕。画面忧郁文艺,王家卫风格。 |
案例 10:节日氛围
| 差 | 好 |
|---|---|
| 春节的样子 | 中国南方乡村的春节夜晚,红灯笼挂满屋檐,几个穿新衣的小孩在院子里燃放烟花,烟花的光照亮他们兴奋的脸。镜头从烟花特写慢慢拉远到全景。画面充满怀旧和年味,电影《你好,李焕英》的色调。 |
五、8 个万能模板(复制即用)
把下面任何一个模板拿走,把方括号里的内容换成你想要的,就能用:
模板 1:自然风光
[季节][时间]的[地点],[主要景物]在[环境状态]中。镜头[运动方式],[光影描述]。画面[风格],[质感]。
填法示例:
春日清晨的西湖,雾气在湖面上缓慢流动。镜头沿湖面缓慢平移,柔和的晨光照在断桥上。画面唯美宁静,水墨画风格。
模板 2:人物特写
[主体特征][动作描述],[环境]。[镜头景别+运动],[光影]。画面[风格],[质感]。
填法示例:
一个穿白色衬衫的年轻男孩在海边迎着风轻轻闭眼,海水轻拍他的脚踝。中景特写,镜头缓慢环绕,金色逆光从侧后方打来。画面治愈温暖,电影质感。
模板 3:产品展示
[产品]放在[场景]中,[环境互动]。镜头[运动],[光影]。画面[质感],[风格]。
填法示例:
一只 iPhone 16 放在木质桌面上,旁边是一杯咖啡和一本书,午后阳光斜照在屏幕上。镜头缓慢环绕产品 360 度,柔和的窗光,背景虚化。画面高级简约,苹果广告质感。
模板 4:宠物视频
[宠物特征]在[场景]中[动作]。[镜头],[光影]。画面[风格]。
填法示例:
一只柴犬在落叶纷飞的公园里追逐自己的影子,开心地摇尾巴。低角度跟拍,秋日金色阳光透过树叶。画面温馨可爱,宫崎骏画风。
模板 5:旅拍 vlog
[城市/地点]的[时间],[主体]在[场景中做什么]。[镜头运动],[光影]。画面[风格],[氛围]。
填法示例:
京都的清晨,一个穿浴衣的女孩走在祇园的石板路上,远处是樱花树。手持跟拍,温暖的晨光照亮石板路。画面治愈唯美,日系小清新风。
模板 6:美食广告
[食物特写],[食物动态]。镜头[运动],[光影]。画面[质感],[风格]。
填法示例:
一块刚出炉的巧克力蛋糕,巧克力酱缓慢从顶部流下来,覆盖整个表面。镜头从俯视缓慢转到侧面特写,柔和的暖光从右上方打来。画面色彩浓郁,食欲感极强,米其林广告风格。
模板 7:城市生活
[城市][时间],[主体]在[做什么]。[镜头],[环境光]。画面[风格],[氛围]。
填法示例:
深圳深夜的便利店,一个穿西装的年轻人站在零食货架前犹豫不决。中景,便利店的冷白光照亮他的脸。画面孤独都市感,王家卫风格。
模板 8:节日纪念
[节日][场景],[人物动作]。[镜头],[氛围光影]。画面[风格],[情感]。
填法示例:
中秋之夜的家庭后院,一家三口围坐在小桌边吃月饼赏月,月光洒在桌上。中景固定镜头,温暖的灯笼光照亮一家人的笑脸。画面温馨怀旧,电影《饮食男女》风格。
六、5 个新手最容易犯的错
错 1:堆砌形容词,不给具体细节
❌ "一个非常美丽、非常温柔、非常优雅的女孩" ✅ "一个 25 岁的女孩,穿米色针织衫和卡其色长裙,温柔地笑"
形容词 AI 听不懂"美丽""漂亮"是什么意思——它需要你描述具体细节。
错 2:写成"语义抽象"的诗
❌ "夜的尽头是孤独的灵魂在游荡" ✅ "深夜的城市街道,一个穿黑色风衣的男人独自走在街灯下"
AI 不会读诗,AI 看的是"画面元素"。诗意的话留给人类,给 AI 写"画面清单"。
错 3:要求互相矛盾
❌ "镜头近景特写,同时展现整个城市" ✅ 选一个:要么"镜头先近景特写主角,再拉远展现整个城市",要么"镜头近景特写主角"。
错 4:忘记写动作
❌ "一只猫坐在窗台上" ⚠️ 没问题,但视频会很"静",像图片。 ✅ "一只猫坐在窗台上,尾巴轻轻摆动,眨了眨眼"
视频要动,必须写动作。
错 5:贪多
❌ 提示词写了 500 字,描述了 20 个主体、10 个动作、5 种光影。 ⚠️ AI 处理不过来,会"挑着画"。 ✅ 一支视频聚焦一件事——一个主体、一个主要动作、一种主要氛围。
七、本章小抄
- 视频提示词的七要素:
- 主体:画面里是谁/什么
- 动作:在做什么
- 场景:在哪、什么时候、天气
- 镜头:景别 + 运动
- 光影:光源、色温、氛围
- 风格:影视感、画质感、情绪基调
- 声音(可选):环境音、音乐、对白
- 万能公式:
[场景时间地点] + [主体外观] + [动作] + [镜头景别+运动] + [光影] + [风格] - 核心原则:你说得越具体,AI 画得越准确。
- 5 个常见错:堆砌形容词、写成诗、自相矛盾、忘记写动作、贪多。
- 8 个万能模板都给了,遇到不会写的时候直接套。
5 分钟动手实验
任务:用本章的"七要素法"重写你 第三章 那条提示词,再生成一次。
具体步骤:
- 回想你第三章那条"金毛犬"的提示词。
- 按七要素重写:
- 主体:把"金毛犬"细化(年龄、表情、外观)
- 动作:从"奔跑"细化(怎么跑、跑向哪)
- 场景:把"傍晚海边"细化(地中海?北海道?什么季节?)
- 镜头:加入景别和运动
- 光影:加入具体光线描述
- 风格:选一个明确的风格(电影感?纪录片?日剧?)
- 用新提示词在即梦再生成一次。
- 把第一次和第二次的视频放一起对比——感受七要素的力量。