ORANGE BOOK · AI VIDEO

第十二章 AI 视频工作流——从脚本到发布的完整流水线


一、什么是"工作流"——为什么要建

1.1 工作流 vs 单点工具

单点工具:每次做视频,你都要打开 5 个 App、复制 8 次内容、想 10 次"下一步该干啥"。

工作流:每个步骤标准化、固定流程、固定工具、甚至自动化执行。

1.2 为什么要建工作流

原因 1:节省"决策成本"

你每天的精力是有限的。每次做视频都"想这步怎么办",会消耗大量精力。

好的工作流让你"不用思考"——按步骤来就行。

原因 2:批量产出

如果你想做 1 支视频,工作流的边际效益不大。

如果你想做 100 支视频,工作流是唯一方式

原因 3:质量稳定

固定流程 = 固定质量。

每次都按同样的流程做,最差的视频也不会差到哪去

原因 4:可复制 / 可外包

工作流标准化了,你可以教别人做、可以雇人代做、可以让 AI 自动做。


二、AI 视频工作流的"标准 9 步"

任何 AI 视频,本质都是这 9 步:

步骤 输入 输出 工具
1. 选题 灵感/趋势 选题清单 豆包/Kimi/DeepSeek
2. 脚本 选题 30-60 秒脚本 豆包/AI 助手
3. 分镜 脚本 分镜清单 自己/AI 辅助
4. 画面 分镜 视频片段 即梦/可灵
5. 配音 脚本 音频文件 剪映/讯飞/ElevenLabs
6. 剪辑 视频片段+音频 成片 剪映
7. 字幕封面 成片 完整成片 剪映/Canva
8. 发布 成片 多平台已发 一键分发工具/手动
9. 复盘 数据 优化方向 自己分析

每一步,我们详细讲。

2.1 步骤 1:选题(10 分钟)

选题来源

  • 趋势平台:抖音/小红书的"热搜""热榜"。
  • 同行账号:看头部账号最近 30 天的爆款。
  • 数据工具:蝉妈妈/新榜数据。
  • AI 推荐:让对话 AI 给你列。

AI 选题提示词模板

我是 [赛道+定位] 的视频博主。请帮我:
1. 列出 2026 年 4 月 [赛道] 的 10 个热点话题
2. 每个话题给一句话的"用户痛点"
3. 每个话题预估"爆款潜力"(高/中/低)
4. 标注"竞争激烈程度"(红海/中等/蓝海)

我的赛道:[xxx]
我的定位:[xxx]
目标平台:[抖音/小红书/视频号]

得到选题清单后:优先选"高潜力 + 蓝海"的

选题清单示例

1. 「30 岁后才开始学英语,怎么办?」(高潜力 + 中等竞争)
2. 「你不知道的雅思口语 5 个隐藏技巧」(中潜力 + 红海)
3. 「为什么新加坡英语越来越火」(高潜力 + 蓝海)
...

2.2 步骤 2:脚本(15 分钟)

AI 脚本提示词模板

请为下面这个选题写一份 60 秒的视频脚本:

选题:[xxx]
平台:抖音/小红书/视频号
受众:[年龄/职业/兴趣]
风格:[幽默/严肃/情感]

要求:
- 开头 3 秒抓眼球(提出反常识、痛点、悬念之一)
- 中间 45 秒核心内容(3 个要点,每个 15 秒)
- 结尾 12 秒"钩子"(呼吁互动、引出下一支视频)
- 整体口语化、节奏紧凑
- 关键句要"短"(每句 ≤15 字)
- 给我配上"画面提示"(每段对应什么画面)

脚本示例(某个选题的成品)

选题:30 岁后才开始学英语,怎么办?

【0-3 秒】抓眼球
脚本:"30 岁了才学英语,是不是太晚了?我用 1 年时间,从只会 hello,到能用英语开会。"
画面提示:数字人说话,背景配"30 岁"+"1 年"两个字幕高亮

【3-18 秒】要点 1
脚本:"第一件事,别背单词。这就是 90% 人 30 岁学英语失败的原因。"
画面提示:AI 生成"一个人对着单词书发呆然后扔掉"的画面

【18-33 秒】要点 2
脚本:"正确的方法是:先看美剧。每天 30 分钟,跟读 5 句台词,3 个月你的口语就不一样了。"
画面提示:AI 生成"一个人边看美剧边跟读"的画面

【33-48 秒】要点 3
脚本:"然后用 AI 当你的 24 小时口语陪练。我用豆包语音版,每天聊 10 分钟,半年达到了流利交流。"
画面提示:AI 生成"一个人和 AI 语音对话"的画面

【48-60 秒】钩子
脚本:"想知道我具体怎么用 AI 练口语?关注我,下一支视频详细讲。"
画面提示:数字人说话,结尾出现"关注 + 下集预告"

2.3 步骤 3:分镜(5 分钟)

把脚本拆成"具体画面清单"。

分镜 时长 内容 视频来源
1 3 秒 数字人开场 剪映数字人
2 5 秒 "扔单词书"画面 即梦生成
3 5 秒 "看单词书发呆"画面 即梦生成
4 5 秒 "看美剧跟读"画面 即梦生成
5 5 秒 "美剧场景特写"画面 即梦生成
6 5 秒 "和 AI 语音聊天"画面 即梦生成
7 5 秒 "手机里的 AI 对话界面" 自己截图
8 12 秒 数字人结尾 + 关注引导 剪映数字人

2.4 步骤 4:画面生成(20 分钟)

把每个分镜的提示词放到即梦/可灵:

分镜 2 提示词

一个 30 岁的女人坐在书桌前,皱眉头看着面前的英语单词书,烦躁地把书扔到一边。中景,柔和的台灯光,氛围疲惫。画面有真实感。

分镜 4 提示词

一个女孩坐在沙发上看英文美剧,认真地跟着剧中人物念台词,电视画面发光。中景固定镜头,温暖的客厅光线,画面有学习氛围。

分镜 6 提示词

一个女孩戴着耳机,对着手机说英语,手机屏幕显示 AI 助手对话界面。近景特写,柔和的居家光线,画面温馨。

每个分镜生成 1-2 次,挑最好的。

2.5 步骤 5:配音(5 分钟)

剪映 → AI 数字人内置配音(如果用数字人)或 → AI 智能配音(独立配音)。

第六章 的方法处理。

2.6 步骤 6:剪辑(15 分钟)

剪辑顺序

  1. 把所有素材(数字人 + AI 生成画面 + 自己拍的)拖到时间轴。
  2. 按分镜顺序排列。
  3. 对齐配音。
  4. 加转场(推荐:基础剪切,少用花式转场)。
  5. 微调时长(删除/重新生成不满意的片段)。
  6. 调整节奏。

剪辑节奏建议

  • 平均每 2-4 秒换一个画面(短视频要快)。
  • 数字人画面不超过总时长的 50%(要有 B 卷)。
  • 关键句配特写画面。
  • 重点信息出现时画面停顿 0.5 秒。

2.7 步骤 7:字幕 + 封面(10 分钟)

字幕

  • 剪映 AI 自动识别字幕。
  • 通读修正错别字。
  • 关键词高亮(黄色 / 大字号)。
  • 字幕样式与你的"账号 IP"统一(每条视频用同一种)。

封面

封面 = 视频的"门面"。70% 的点击率取决于封面。

封面 3 要素
要素 要求
主标题 10-15 字、大号、对比色(黄/红/白)
主图 1 张抓眼球的图(人物表情/反差/悬念)
副标题 5-10 字、小一号、副色
封面工具
  • 剪映"自动封面":从视频选 5 张帧,让你挑。
  • Canva:模板封面神器。
  • 创客贴 / 稿定设计:免费模板多。
  • 即梦图片版:生成"封面专属图"。
  • MidJourney:高质量原创封面图。
封面文案技巧
技巧 例子
数字 「3 个方法」「30 天提升」
反常识 「90% 人都搞错了」
痛点 「30 岁还学英语晚吗?」
悬念 「这件事千万别做」
对比 「我做了 vs 我没做」

2.8 步骤 8:发布(10 分钟)

多平台发布顺序

平台 优先级 适合时段 标题策略
抖音 必发 19-23 点 标题 8-15 字、悬念为主
小红书 必发 12-14 点、20-23 点 标题 15-25 字、关键词密集
视频号 必发 早 7-9 点、晚 21-23 点 标题 10-20 字、情感共鸣
B 站 看品类 19-23 点 标题 15-30 字、可以更长
公众号视频 选发 早 7-9 点 配长文
头条号 选发 12-14 点、19-22 点 标题热搜风

标题模板

模板 1:数字 + 痛点
30 岁后才学英语,做对这 3 件事就够了
模板 2:反常识 + 悬念
90% 的人学英语第一步就错了
模板 3:身份代入
30 岁宝妈,我用 1 年时间⋯⋯
模板 4:高情绪开头
吓死我了!30 岁居然还能这么学英语

Tag / 话题选择

  • 用平台热搜话题。
  • 加 3-5 个相关 tag。
  • 不要堆砌(太多反而被判作弊)。

2.9 步骤 9:复盘(5 分钟)

发布 24 小时后看数据:

指标 健康范围 不健康原因
完播率 >40% 内容拖沓、开头不抓人
点赞率 >5% 内容没共鸣
评论率 >1% 没引导互动
转发率 >0.5% 内容没"转发价值"
关注率 >2% 账号定位不清

每周复盘一次:找出最爆的 1 支 + 最差的 1 支,分析原因。


三、3 套不同规模的工作流

3.1 工作流 A:轻量版(个人爱好者)

目标:每周 1-2 支,不追求变现。

工具栈

  • 豆包(脚本)
  • 即梦(画面)
  • 剪映(剪辑+配音+字幕)

时间投入

  • 选题:5 分钟
  • 脚本:5 分钟
  • 画面生成:10 分钟
  • 剪辑:15 分钟
  • 发布:5 分钟
  • 总计:40 分钟/支

3.2 工作流 B:标准版(自媒体起号)

目标:日更 1 支,3-6 个月起号。

工具栈

  • 豆包/DeepSeek(脚本)
  • 即梦 + 可灵(画面)
  • 剪映 Pro(剪辑+配音+字幕+数字人)
  • Canva(封面)

流程优化

  • 周日晚上:列下周 7 天的选题清单。
  • 周一早上:批量写 7 个脚本。
  • 周一-周五:每天用 30 分钟做当天视频。
  • 每天 19 点:发布。
  • 周末:复盘 + 优化。

时间投入

  • 准备:周日 1 小时
  • 日更:30 分钟/天
  • 复盘:周末 30 分钟
  • 总计:每天 30 分钟 + 周末 1.5 小时

3.3 工作流 C:矩阵版(专业变现)

目标:5+ 个账号、多平台、月入 1 万+。

工具栈

  • 豆包/DeepSeek(脚本)
  • 可灵 Pro + Sora(画面)
  • HeyGen(多语言数字人)
  • 剪映 Pro(剪辑+配音)
  • Coze/扣子(自动化工作流)
  • 蝉妈妈(数据分析)
  • 多平台一键发布工具(如"易媒助手")

流程

  • 1 个核心 IP + 5 个分发账号(不同平台/不同细分定位)。
  • 1 套核心内容5 个版本变体(不同标题/封面/剪辑节奏)。
  • 每天产出 5 支视频(每个账号 1 支)。
  • 每周复盘 + 调整。

团队结构

如果一个人扛不住,可以雇人:

  • 你:选题 + 脚本 + 把控质量。
  • 助理 1:画面生成 + 剪辑。
  • 助理 2:发布 + 数据。

时间投入

  • 你:每天 2 小时
  • 助理:每天各 4-6 小时

成本

  • 工具会员:月 500-1000 元
  • 助理工资:月 3000-8000 元/人
  • 总成本:月 5000-15000 元

收益预期

  • 起步期(前 3 个月):投入 = 收入。
  • 稳定期(3-6 个月):月入 1-3 万元。
  • 爆发期(6 个月+):月入 5-30 万元。

四、用 Coze/扣子搭"一键按钮"

这是进阶玩法。

4.1 Coze 是什么

Coze(中文叫"扣子")是字节出的"零代码 AI 智能体平台"——你可以拖拽组件搭出"AI 工作流",不需要会编程。

coze.cn

4.2 用 Coze 搭"AI 视频自动化工作流"

案例:知识口播视频生产工作流

工作流逻辑

输入:一个选题关键词

→ Coze 自动调用脚本生成 AI(生成 60 秒脚本)

→ Coze 自动调用即梦 API(生成画面)

→ Coze 自动调用剪映/HeyGen(生成数字人)

→ Coze 自动合成视频

→ 输出:一支完整视频

简化操作

  1. 注册 Coze。
  2. 创建新工作流。
  3. 拖拽组件:
    • 输入节点(接收"选题")
    • LLM 节点(生成脚本)
    • 即梦插件(生成画面)
    • 剪映/HeyGen 插件(生成数字人)
    • 合成节点
  4. 测试运行。
  5. 发布为"应用"——你或团队成员可以一键调用。

4.3 Coze 的"半自动"思路

完全自动化(端到端 AI 生产)2026 年还做不到完美。

半自动化才是最实用的:

  • AI 自动完成 70% 工作(选题、脚本、画面初版、配音)。
  • 人工干预 30%(脚本润色、画面替换、最终剪辑)。

这种模式让 1 个人能产出 5 个人的内容量


五、矩阵号管理(高级技能)

5.1 什么叫"矩阵号"

矩阵号 = 同一主题/同一团队下的多个账号。

  • 抖音 5 个 + 小红书 5 个 + 视频号 5 个 = 15 个账号。
  • 每个账号定位略有不同(同主题不同切入点)。
  • 同一套内容,分发到所有账号(做差异化变体)。

5.2 矩阵号的好处

  • 降低单个账号的风险(一个账号被封,不会全军覆没)。
  • 覆盖更多用户(每个账号触达不同人群)。
  • 变现机会乘数增长(5 个变现点 vs 1 个)。

5.3 矩阵号的坑

  • 平台规则:同一手机号/同一身份证下做太多账号会被识别为"机器号"。
  • 内容差异化:完全复制粘贴会被平台限流。
  • 管理成本:账号越多,运营成本越高。
  • 质量稀释:精力分散反而每个都做不好。

5.4 实操建议

  • 新手不要做矩阵——先把 1 个账号做到 1 万粉。
  • 做到 1 万粉后再考虑矩阵。
  • 矩阵不超过 5 个起步。
  • 用不同手机号注册,避免风控。
  • 内容做"伪原创"(同一主题、不同表达)。

六、本章小抄

  • 工作流 = 标准化流程,让做视频从"思考"变成"执行"。
  • AI 视频工作流的"标准 9 步":选题→脚本→分镜→画面→配音→剪辑→字幕封面→发布→复盘。
  • 3 套规模工作流:
    • 轻量版(每周 1-2 支):豆包+即梦+剪映
    • 标准版(日更):标准版+ Canva+ 数字人 Pro
    • 矩阵版(多账号变现):标准版+ Coze+ HeyGen+ 多平台分发工具
  • 用 Coze/扣子可以把工作流自动化为"一键按钮"。
  • 矩阵号是放大器,但要先把 1 个账号做好再扩展。

5 分钟动手实验

任务

  1. 选你最近想做的 1 支视频。
  2. 按本章的 9 步走一遍——把每一步的"产出"写下来(选题、脚本、分镜⋯⋯)。
  3. 完成全流程,记录每一步花了多少时间。
  4. 做完一次,下一次就能优化掉 50% 的时间。

进阶

  • 注册 Coze,搭一个最简单的"输入选题→输出脚本"的工作流。

下一章:第十三章 从使用者到创作者——你的第一个变现作品