ORANGE BOOK · AI VIDEO

第四章 视频提示词入门——告诉 AI 我想看到什么


一、为什么同样的工具,别人出大片,你出垃圾片?

我们先看一组真实对比。

案例 A:菜鸟提示词

提示词:

一个女孩在海边

生成结果:你大概率得到的是——一个女孩呆呆地站在海边,构图普通、光线平淡、画面像家庭录像。

案例 B:高手提示词

提示词:

傍晚的地中海海岸,一个穿白色长裙的金发女孩赤脚走在湿润的沙滩上,海风吹起她的裙摆和头发。镜头从侧面跟随她缓慢移动,夕阳的金色余晖透过头发,背景是渐变的紫粉色天空和远处的小帆船。画面唯美、电影感、35mm 胶片质感。

生成结果:你大概率得到的是——电影《爱在黄昏破晓时》同款画面,光影、色彩、构图都很高级。

两个提示词的区别在哪?

不是字数。是信息量

第一条提示词,你只告诉了 AI 两件事:

  • 主体:女孩
  • 场景:海边

AI 只能"自己脑补"剩下的 95%——什么样的女孩?穿什么?海边什么时候?什么角度?什么光线?什么风格?AI 脑补出来的东西,自然平庸。

第二条提示词,你告诉了 AI 整整 12 件事:

  • 时间:傍晚
  • 地点:地中海海岸
  • 主体:金发女孩
  • 服装:白色长裙
  • 状态:赤脚、走在沙滩
  • 环境互动:海风吹起裙摆和头发
  • 镜头:侧面跟随、缓慢移动
  • 光线:夕阳金色余晖
  • 颜色:紫粉色天空
  • 背景元素:远处帆船
  • 风格:电影感
  • 质感:35mm 胶片

AI 知道得越多,"自己脑补"的部分越少,结果就越接近你想要的样子。

写视频提示词的核心原则就一句话:你说得越具体,AI 画得越准确。


二、视频提示词的"七要素"

把上面那条高手提示词拆开,你会发现它其实有一个通用结构。这就是本章要教你的核心:

视频提示词 = 主体 + 动作 + 场景 + 镜头 + 光影 + 风格 + 声音

我们一个一个讲。

要素 1:主体(Subject)—— 画面里的"主角"

回答:画面里是谁/什么

写法 优劣
一个人 ❌ 太模糊
一个女孩 ⚠️ 还是模糊
一个 25 岁的金发女孩 ✅ 具体
一个穿白色长裙、赤脚、长发飘飘的 25 岁金发女孩 ✅✅ 非常具体

主体描述要点

  • 种类:人、动物、物品、自然景物。
  • 属性:年龄、性别、品种、颜色、大小。
  • 外观:穿着、发型、表情、神态。
  • 数量:1 个、2 个、3 个、一群。

反例

  • ❌ "一些人在跳舞" —— "一些"是几个?什么人?什么舞?
  • ✅ "三个穿汉服的年轻女孩在月光下跳古典舞"

要素 2:动作(Action)—— 主角"在干什么"

回答:主角在做什么?发生了什么?

写法 优劣
一只猫 ❌ 没动作(视频是动的,没动作就和图片差不多)
一只猫坐着 ⚠️ 有动作但太弱
一只猫跳起来抓蝴蝶 ✅ 动作明确
一只橘猫从沙发上一跃而起,伸出爪子去抓飞过的蝴蝶 ✅✅ 动作生动具体

动作描述要点

  • 视频和图片最大的区别就是"有运动"——一定要写动作。
  • 动作可以是人物动作(走、跑、跳、转身、微笑)。
  • 也可以是环境动作(云在飘、水在流、雪在下、风吹过)。
  • 越具体越好:从"走"到"轻盈地走"到"踩着碎步走"。

反例

  • ❌ "一个人在公园" —— 在公园干嘛?站着?走着?躺着?
  • ✅ "一个穿运动装的男人在公园林间小路上慢跑,呼气在冷空气里成白雾"

要素 3:场景(Scene)—— 在哪、什么时候、天气怎样

回答:在哪里?什么时候?什么环境?

维度 例子
地点 地中海海边、北京胡同、东京涩谷、家中客厅、教室、机场
时间 清晨、正午、黄昏、深夜、午后、凌晨 5 点
季节 春天、夏天、秋天、冬天
天气 晴天、雨天、雪天、雾天、阴天
环境元素 远处的山、地上的落叶、墙上的涂鸦、桌上的咖啡

反例

  • ❌ "在外面" —— 哪个外面?
  • ✅ "深秋傍晚的北京胡同,地上铺满金黄落叶,远处传来鸽哨声"

要素 4:镜头(Camera)—— 镜头怎么动、构图怎么样

这一点是最容易被新手忽略,但对效果影响最大的。

镜头描述包括两件事:景别(拍多远)+ 运动(镜头怎么动)。

景别(拍多远)

景别 含义 用法举例
特写 只拍局部(一只眼睛、一双手) 表达情感、细节
近景 头部到胸部 对话、表情
中景 头到腰 一般人物拍摄
全景 整个人 展现动作
远景 人物在大场景里 展现环境氛围
大远景 鸟瞰、航拍 史诗感、震撼感

镜头运动

运动 含义
(推进、推近) 镜头向前移动(拉近主体)
(拉远) 镜头向后移动(拉远)
(pan) 镜头不动,摇向左/右
(trucking) 镜头平行移动
(跟随) 镜头跟着主体动
升降(crane) 镜头从低到高(或反之)
环绕(orbit) 镜头围绕主体转一圈
手持 模拟手持的微微晃动感
航拍 从空中俯视
第一人称视角 像主角的眼睛在看

例子

  • "镜头从特写开始,缓慢拉远到全景,展现出辽阔的草原" —— 强调"渺小感"。
  • "镜头紧紧跟随奔跑的少年,手持感的轻微晃动" —— 强调"代入感"。
  • "无人机航拍,从城市上空缓慢俯冲" —— 强调"震撼感"。

要素 5:光影(Lighting)—— 光从哪来、什么颜色、什么气氛

光影直接决定了画面"高级"还是"廉价"。

描述维度 例子
光源方向 顶光(正上方)、侧光(侧面)、逆光(从主体后面来)、底光(从下往上)、自然光、室内灯光
光线性质 柔和、强烈、刺眼、朦胧、漫射、聚焦
色温 暖光(金黄色)、冷光(蓝白色)、霓虹色、烛光(橙红色)
氛围 温暖、清冷、神秘、浪漫、紧张、压抑
特效光 丁达尔光(光柱)、镜头光晕、烛火、月光、霓虹反射

例子

  • "金色的夕阳从背后照射,形成温暖的逆光,主体边缘有金色光环"
  • "霓虹灯的粉色和蓝色交叠在主角脸上"
  • "顶光强烈,主体的影子在地面拉得很长"

要素 6:风格(Style)—— 整体美学和情绪

风格类型 例子
影视风格 电影感、纪录片风、好莱坞大片、日剧、韩剧、宫崎骏、王家卫风
画面质感 35mm 胶片、超清写实、油画感、水彩感、铅笔画、像素风
年代感 复古 80 年代、未来感、赛博朋克、蒸汽朋克、文艺复兴
色调 高饱和、低饱和、单色、撞色、莫兰迪色
情绪基调 治愈、忧郁、热血、紧张、悬疑、浪漫

例子

  • "宫崎骏动画风格、温暖治愈、轻盈梦幻"
  • "赛博朋克 2077 风格、霓虹紫红、科幻末世感"
  • "王家卫电影风格、低饱和、慢镜头、情感张力"

要素 7:声音(Sound)—— 环境声、音乐、对白

注意:不是所有 AI 视频工具都支持"生成声音"。Sora 2、Veo 3 自带音频生成;可灵、即梦等大多数工具默认不带声音,但你可以在剪映里后期加声音。

如果工具支持音频生成,可以描述:

  • 环境音:海浪声、雨声、风声、城市嘈杂声、林间鸟鸣
  • 音乐:钢琴轻柔旋律、激昂电吉他、电子节拍
  • 对白:人物说"早上好"
  • 音效:脚步声、关门声、爆炸声

例子

  • "背景声:海浪声、远处海鸥叫声,配以钢琴轻柔旋律"

三、把七要素套到一起:万能公式

记不住七要素?给你一个万能公式

[场景时间地点] + [主体外观] + [动作] + [镜头景别+运动] + [光影] + [风格]

举例填空:

要素 你填的内容
场景时间地点 春日清晨的北京胡同
主体外观 一个穿米色风衣的年轻女孩
动作 慢慢推开木门,迎面阳光照来
镜头景别+运动 中景,镜头缓慢推进
光影 柔和的逆光,金色阳光透过门缝
风格 王家卫电影风、低饱和、文艺感

拼起来:

春日清晨的北京胡同,一个穿米色风衣的年轻女孩慢慢推开木门,迎面阳光照来。中景,镜头缓慢推进,柔和的逆光,金色阳光透过门缝。王家卫电影风、低饱和、文艺感。

直接复制到即梦或可灵,大概率出片


四、10 个"差→好"对照案例

这是新手最该看的部分。每个案例展示同一个想法的"两版提示词"——左边是你可能写的,右边是更好的写法。

案例 1:宠物视频

一只可爱的猫 一只蓝色短毛猫趴在窗台上,看着窗外飘落的樱花,轻轻眨眼。午后阳光透过窗户洒在它身上,毛发微微闪光。镜头从侧面缓慢推近,画面温馨治愈,宫崎骏画风。

案例 2:风景视频

美丽的山脉 清晨的喜马拉雅山脉,晨雾在山谷中缓慢流动,第一缕金色的阳光照亮雪峰。航拍镜头从云海中缓慢飞过,展现壮丽的山峰群。画面史诗感、Discovery 纪录片风格。

案例 3:人物特写

一个女孩笑了 一个 22 岁的东方女孩,温柔地笑了一下,眼睛微微弯起。近景特写,柔和的窗光从侧面照来,背景虚化。画面像日剧《情书》的氛围,35mm 胶片质感。

案例 4:城市夜景

城市的夜晚 上海外滩深夜,黄浦江两岸高楼霓虹闪烁,江面倒映着东方明珠的灯光。无人机镜头从浦西缓慢平移到浦东,整个画面充满都市感和繁华感。赛博朋克色调,紫粉色霓虹氛围。

案例 5:美食视频

一碗面条 木质桌面上的一碗热气腾腾的兰州牛肉拉面,红色的辣椒油浮在汤面上,绿色的香菜点缀其中。镜头从俯视角度缓慢旋转,蒸汽袅袅升起。画面色彩饱和、食欲感强、商业广告级质感。

案例 6:运动视频

有人在跑步 清晨 6 点的城市街道,一个穿黑色运动装的男人在晨光中慢跑,呼气在冷空气中变成白雾。镜头从低角度跟随,背景是模糊的城市建筑。画面有 Nike 广告的运动感和热血感。

案例 7:温馨家庭

一家人在家里 周日早晨的家庭厨房,一对年轻夫妇和 5 岁的女儿一起做煎蛋早餐,女儿坐在父亲肩上看母亲翻锅。阳光从窗户洒进来,画面温暖。中景固定镜头,画面温馨治愈,像家庭生活类广告。

案例 8:科幻场景

一艘宇宙飞船 浩瀚的宇宙深空,一艘银色的星际飞船缓慢飞过,背景是色彩斑斓的星云和远处的双子星。镜头从飞船尾部缓慢拉远,展现飞船的渺小。画面如《星际穿越》般史诗壮丽,超清电影质感。

案例 9:抒情慢镜头

雨天的窗户 秋日午后,窗户上的雨珠缓慢滚落,玻璃外的城市街道被雨水模糊。慢镜头特写雨珠滚落的过程,背景是柔和的暖色光晕。画面忧郁文艺,王家卫风格。

案例 10:节日氛围

春节的样子 中国南方乡村的春节夜晚,红灯笼挂满屋檐,几个穿新衣的小孩在院子里燃放烟花,烟花的光照亮他们兴奋的脸。镜头从烟花特写慢慢拉远到全景。画面充满怀旧和年味,电影《你好,李焕英》的色调。

五、8 个万能模板(复制即用)

把下面任何一个模板拿走,把方括号里的内容换成你想要的,就能用:

模板 1:自然风光

[季节][时间]的[地点],[主要景物]在[环境状态]中。镜头[运动方式],[光影描述]。画面[风格],[质感]。

填法示例

春日清晨的西湖,雾气在湖面上缓慢流动。镜头沿湖面缓慢平移,柔和的晨光照在断桥上。画面唯美宁静,水墨画风格。

模板 2:人物特写

[主体特征][动作描述],[环境]。[镜头景别+运动],[光影]。画面[风格],[质感]。

填法示例

一个穿白色衬衫的年轻男孩在海边迎着风轻轻闭眼,海水轻拍他的脚踝。中景特写,镜头缓慢环绕,金色逆光从侧后方打来。画面治愈温暖,电影质感。

模板 3:产品展示

[产品]放在[场景]中,[环境互动]。镜头[运动],[光影]。画面[质感],[风格]。

填法示例

一只 iPhone 16 放在木质桌面上,旁边是一杯咖啡和一本书,午后阳光斜照在屏幕上。镜头缓慢环绕产品 360 度,柔和的窗光,背景虚化。画面高级简约,苹果广告质感。

模板 4:宠物视频

[宠物特征]在[场景]中[动作]。[镜头],[光影]。画面[风格]。

填法示例

一只柴犬在落叶纷飞的公园里追逐自己的影子,开心地摇尾巴。低角度跟拍,秋日金色阳光透过树叶。画面温馨可爱,宫崎骏画风。

模板 5:旅拍 vlog

[城市/地点]的[时间],[主体]在[场景中做什么]。[镜头运动],[光影]。画面[风格],[氛围]。

填法示例

京都的清晨,一个穿浴衣的女孩走在祇园的石板路上,远处是樱花树。手持跟拍,温暖的晨光照亮石板路。画面治愈唯美,日系小清新风。

模板 6:美食广告

[食物特写],[食物动态]。镜头[运动],[光影]。画面[质感],[风格]。

填法示例

一块刚出炉的巧克力蛋糕,巧克力酱缓慢从顶部流下来,覆盖整个表面。镜头从俯视缓慢转到侧面特写,柔和的暖光从右上方打来。画面色彩浓郁,食欲感极强,米其林广告风格。

模板 7:城市生活

[城市][时间],[主体]在[做什么]。[镜头],[环境光]。画面[风格],[氛围]。

填法示例

深圳深夜的便利店,一个穿西装的年轻人站在零食货架前犹豫不决。中景,便利店的冷白光照亮他的脸。画面孤独都市感,王家卫风格。

模板 8:节日纪念

[节日][场景],[人物动作]。[镜头],[氛围光影]。画面[风格],[情感]。

填法示例

中秋之夜的家庭后院,一家三口围坐在小桌边吃月饼赏月,月光洒在桌上。中景固定镜头,温暖的灯笼光照亮一家人的笑脸。画面温馨怀旧,电影《饮食男女》风格。

六、5 个新手最容易犯的错

错 1:堆砌形容词,不给具体细节

❌ "一个非常美丽、非常温柔、非常优雅的女孩" ✅ "一个 25 岁的女孩,穿米色针织衫和卡其色长裙,温柔地笑"

形容词 AI 听不懂"美丽""漂亮"是什么意思——它需要你描述具体细节

错 2:写成"语义抽象"的诗

❌ "夜的尽头是孤独的灵魂在游荡" ✅ "深夜的城市街道,一个穿黑色风衣的男人独自走在街灯下"

AI 不会读诗,AI 看的是"画面元素"。诗意的话留给人类,给 AI 写"画面清单"。

错 3:要求互相矛盾

❌ "镜头近景特写,同时展现整个城市" ✅ 选一个:要么"镜头先近景特写主角,再拉远展现整个城市",要么"镜头近景特写主角"。

错 4:忘记写动作

❌ "一只猫坐在窗台上" ⚠️ 没问题,但视频会很"静",像图片。 ✅ "一只猫坐在窗台上,尾巴轻轻摆动,眨了眨眼"

视频要动,必须写动作。

错 5:贪多

❌ 提示词写了 500 字,描述了 20 个主体、10 个动作、5 种光影。 ⚠️ AI 处理不过来,会"挑着画"。 ✅ 一支视频聚焦一件事——一个主体、一个主要动作、一种主要氛围。


七、本章小抄

  • 视频提示词的七要素
    1. 主体:画面里是谁/什么
    2. 动作:在做什么
    3. 场景:在哪、什么时候、天气
    4. 镜头:景别 + 运动
    5. 光影:光源、色温、氛围
    6. 风格:影视感、画质感、情绪基调
    7. 声音(可选):环境音、音乐、对白
  • 万能公式[场景时间地点] + [主体外观] + [动作] + [镜头景别+运动] + [光影] + [风格]
  • 核心原则:你说得越具体,AI 画得越准确。
  • 5 个常见错:堆砌形容词、写成诗、自相矛盾、忘记写动作、贪多。
  • 8 个万能模板都给了,遇到不会写的时候直接套。

5 分钟动手实验

任务:用本章的"七要素法"重写你 第三章 那条提示词,再生成一次。

具体步骤:

  1. 回想你第三章那条"金毛犬"的提示词。
  2. 按七要素重写:
    • 主体:把"金毛犬"细化(年龄、表情、外观)
    • 动作:从"奔跑"细化(怎么跑、跑向哪)
    • 场景:把"傍晚海边"细化(地中海?北海道?什么季节?)
    • 镜头:加入景别和运动
    • 光影:加入具体光线描述
    • 风格:选一个明确的风格(电影感?纪录片?日剧?)
  3. 用新提示词在即梦再生成一次。
  4. 把第一次和第二次的视频放一起对比——感受七要素的力量。

下一章:第五章 视频提示词进阶——让 AI 听话的 12 个技巧