ORANGE BOOK · AI VIDEO

第十一章 AI 数字人与虚拟主播——24 小时为你打工


一、为什么数字人是"AI 视频的核武器"

数字人的核心价值用一句话总结:

数字人 = 你 × N——它把"你"这个有限的人,变成可以无限复制、24 小时工作、不会累、不会涨工资、不会跳槽的"超级你"。

举个例子:

  • 真人你:每天最多录 1 小时视频,1 周最多发 7 支。
  • 数字人你:每天可以同时输出 100 支视频,每支都是"你"在讲。

数字人的应用场景:

场景 真人能做的 数字人能做的
录制口播视频 每天 1-2 支 每天 50+ 支
直播带货 每天 4-6 小时 24 小时不停
多语言版本 需要找翻译 + 重录 一键克隆 + 多语言
同时管理多账号 不可能 1 个数字人 = 5+ 账号
老板一直亲自上镜 不可能 数字人代替

这就是为什么数字人值得每个普通人花 1 小时学会


二、数字人到底是什么——4 种类型

很多人以为"数字人"是一种东西,其实有 4 种完全不同的形态。

2.1 类型 1:通用数字人(预设模板)

特征:平台提供的"标准形象",所有人都能用。

例子:剪映里的"教授男""都市丽人""暖男"等几十个免费数字人。

优势

  • 完全免费。
  • 5 秒上手。
  • 没有"克隆失真"问题。

劣势

  • 长得不像你。
  • 别人也可能用同一个。
  • 没有"独特性"。

适合谁:新手、批量内容、不在意"个人 IP"的场景。

2.2 类型 2:自定义克隆数字人

特征:用一张照片 + 一段录音"克隆"出"你的样子的数字人"。

例子:HeyGen、剪映 Pro 自定义、D-ID 都支持。

优势

  • 长得就是你。
  • 声音就是你。
  • 独一无二。

劣势

  • 需要付费(剪映 Pro 88 元/月起;HeyGen $24/月起)。
  • 克隆质量取决于素材质量(照片清晰度、录音环境)。
  • 偶尔有"恐怖谷"效应(有些人看着像你但不是你)。

适合谁:长期做自媒体、做个人 IP、想要"独特"的人。

2.3 类型 3:超写实数字人

特征:用 AI 生成"完全虚构但极度真实"的人。

例子:用即梦/MidJourney 先生成一个"虚构人物"图,再用 HeyGen 把它做成数字人。

优势

  • 完全可控(你想要什么样的人都行)。
  • 没有真人的肖像权问题。
  • 可以"设计"完美形象。

劣势

  • "完美"过了头反而不真实。
  • 用户能看出"不是真人"。
  • 不如真人有亲和力。

适合谁:做品牌虚拟代言人、做完全虚拟的 IP。

2.4 类型 4:2D / 3D 卡通数字人

特征:纯卡通形象的数字人。

例子:B 站很多虚拟 UP 主、剪映卡通数字人、Live2D 角色。

优势

  • 不真实就不会被"恐怖谷"。
  • 二次元/年轻用户喜欢。
  • 形象可以非常夸张。

劣势

  • 不适合所有人群(中老年用户接受度低)。
  • "亲和力"不如真人。

适合谁:年轻向、二次元、儿童内容。

2.5 选型决策树

你想做数字人 →
  你有钱吗?
    没钱 → 用通用数字人(剪映免费款)
    有钱 →
      你想要"独特性"吗?
        不需要 → 通用数字人(依然推荐免费)
        需要 →
          你愿意"上镜"吗?
            愿意 → 自定义克隆(用你自己的脸)
            不愿意 →
              你的目标用户是?
                大众/中老年 → 超写实虚拟人
                年轻/二次元 → 卡通数字人

三、5 分钟克隆"你的数字人"完整教程

我们以最常用的 剪映 Pro 自定义数字人 为例。

Step 1:开通剪映 Pro 会员

  • 剪映 App → 我的 → 开通会员(88 元/月起,建议先买 1 个月试试)。

Step 2:拍 1 张你的"标准照"

要求:

  • 光线均匀(不要逆光、不要阴阳脸)。
  • 正脸(不要侧脸、不要低头)。
  • 表情中性(微微微笑或自然)。
  • 背景简洁(白墙最好)。
  • 只有你一个人(没有其他人入镜)。
  • 高清(建议 1080p 以上)。

拍照技巧

  • 室内白墙前 + 自然光(窗户旁边)。
  • 手机距脸 1 米左右。
  • 找朋友帮你拍(自拍角度容易失真)。
  • 多拍 5-10 张备选。

Step 3:录 1 段你的"标准录音"

要求:

  • 长度:30 秒 - 2 分钟。
  • 内容:朗读一段标准的中文(推荐《荷塘月色》或随便一段新闻稿)。
  • 环境:安静(最好用衣柜里的衣服环绕,吸音)。
  • 设备:手机自带的录音 App 即可(不需要专业麦)。
  • 语速:正常(你日常说话的速度)。
  • 情绪:平和(不要太激动、不要太低落)。

录音技巧

  • 戴耳机录(避免听到自己的声音影响发挥)。
  • 录之前喝几口温水(润喉)。
  • 录 3 遍,挑最好的那遍。
  • 不要在嘈杂环境录(地铁、街边、办公室开会时)。

Step 4:上传素材到剪映

  • 剪映 App → AI 数字人 → 自定义数字人 → 创建新形象。
  • 上传刚才的照片。
  • 上传刚才的录音。

Step 5:等待克隆完成

  • 一般 5-30 分钟。
  • 平台会发通知告诉你完成了。

Step 6:测试你的数字人

  • 输入一段测试文字:"大家好,我是 [你的名字],今天我想和大家分享⋯⋯"
  • 让数字人念出来。
  • 看效果。

Step 7:调优

如果效果不满意:

  • 重新拍照(光线/角度可能有问题)。
  • 重新录音(环境/语速可能有问题)。
  • 多次迭代直到满意。

四、多语言数字人——让"你"讲世界各国语言

这是数字人最魔幻的功能

4.1 工具:HeyGen 多语言克隆

操作步骤

  1. 注册 HeyGen ($24/月)。
  2. 上传 2 分钟英文/中文录音作为"声纹样本"。
  3. 上传你的视频/照片作为"形象样本"。
  4. HeyGen 给你克隆出"会说 30+ 种语言的你"。
  5. 之后任何文本,HeyGen 都能用"你的样子 + 你的声音 + 任何语言"念出来。

4.2 使用场景

  • 中文博主出海 YouTube:把中文视频自动翻译成英文版,"你"还在画面里。
  • 跨国企业宣传:CEO 一次录制,自动生成 30 种语言版本。
  • 教育出海:英语老师可以"用法语""西语""阿语"再讲一遍。

4.3 多语言数字人的"真实程度"

2026 年的水平:

  • 嘴型对齐:90%(基本看不出是配音)。
  • 声音相似度:85%(听起来像你)。
  • 情感传达:70%(情绪稍弱于母语)。

也就是说:用户完全分辨不出是 AI 生成的多语言版本

4.4 真实案例

杭州一位英语博主,2025 年用 HeyGen 把自己 100 支中文视频翻译成英文版,发到 YouTube。

半年后:

  • YouTube 频道粉丝从 0 到 25 万。
  • 单月广告收入:$3000。
  • 接到 3 个海外品牌广告:$5000-$15000/单。

她说:"这件事我没多花一分钟时间——视频本来就有,HeyGen 自动翻译。"


五、数字人直播——24 小时不停的"主播"

直播带货是当下最火的商业模式之一,但人不能 24 小时直播

数字人可以。

5.1 数字人直播工具

国内主流

  • 腾讯智影直播:内置数字人 + 自动话术。
  • 剪映直播伴侣:剪映出品。
  • 微信视频号数字人直播:官方支持。
  • KreadoAI:海外起家,国内也好用。
  • Pollo AI 直播:电商场景强。

国外主流

  • HeyGen Live:超写实数字人直播。
  • Synthesia Studio:企业级直播解决方案。

5.2 数字人直播能做什么

能做

  • 24 小时不停播。
  • 同时多账号直播。
  • 标准化话术(不会忘词)。
  • 多语言(同时直播中英文)。
  • 低成本(不用请主播)。

不能做

  • 真实互动(无法回答用户突发问题)。
  • 真情实感(卖情怀、讲故事会显得"假")。
  • 高客单价产品(用户不信任)。
  • 主播 IP 内容(粉丝要看真人)。

5.3 数字人直播效果对比

指标 真人主播 数字人主播
时间投入 4-8 小时/天 0 小时/天
人力成本 5000-3 万元/月 几百-几千元/月
转化率(普通商品) 1-3% 0.5-2%
转化率(高客单价) 3-8% 1-3%
用户互动质量
适合品类 服装、美妆、食品(需要展示) 标品、日用品、3C

5.4 数字人直播的"半人半机"模式(最实用)

完全无人直播效果有限,但真人 + 数字人结合效果好:

模式

  • 白天:真人主播直播 4 小时(黄金时段、复杂讲解、互动)。
  • 晚上 + 凌晨:数字人接力直播 20 小时(标准话术、订单处理、低人流时段)。

效果:直播间 24 小时不空,转化提升 2 倍。

5.5 平台规则

⚠️ 注意 2026 年最新平台规则

  • 抖音:要求数字人直播必须显著标注"AI 主播"
  • 视频号:允许数字人直播但要求实名认证 + 标注。
  • 淘宝直播:允许,需要店铺认证。
  • 快手:允许,要求标注。

违规会被封号——务必合规。


六、数字人的变现 8 种方式

方式 1:知识口播变现(最稳)

  • 用数字人代你出镜做知识科普。
  • 涨粉后:广告 + 带货 + 课程。
  • 月入:5000–5 万。

方式 2:矩阵号变现

  • 1 个数字人 → 5+ 抖音/视频号/小红书账号。
  • 多账号分发同一内容(注意要做"差异化")。
  • 月入:1–10 万。

方式 3:数字人直播带货

  • 24 小时不停播。
  • 适合标品(如百货、零食、日用品)。
  • 月入:1–20 万(取决于品类和流量)。

方式 4:企业宣传服务

  • 帮中小企业做数字人代言/CEO 数字人。
  • 单价:3000–3 万元/单。
  • 月入:1–10 万。

方式 5:教育/培训视频

  • 老师克隆数字人,做"无限版"在线课。
  • 学生扫码看"老师"讲解。
  • 月入:5000–5 万。

方式 6:多语言出海

  • 中文内容用数字人翻译成英文/日文/西文。
  • 在国外平台变现(YouTube、TikTok 国际版)。
  • 月入:$1000–$10000。

方式 7:数字人定制服务

  • 帮别人做数字人(克隆、脚本、视频生产)。
  • 单价:500–5000 元/人/月。
  • 月入:1–10 万(积累 20+ 客户)。

方式 8:数字人 IP 周边

  • 设计一个超写实/卡通数字人 IP。
  • 涨粉后做周边(手办、表情包、衍生品)。
  • 月入:1 万-50 万(看 IP 影响力)。

七、数字人的法律和伦理边界

7.1 必须遵守的"3 条红线"

红线 1:不能未经授权克隆别人的脸

  • 用别人的照片做数字人 → 侵犯肖像权 → 可能被起诉。
  • 即使是公众人物(明星、网红)也不能擅自用。

红线 2:不能用数字人冒充真人欺骗

  • 用 AI 数字人冒充亲友打电话/发视频 → 诈骗罪。
  • 用 AI 数字人发布虚假新闻 → 散布谣言罪。
  • 用 AI 数字人色情/政治内容 → 严重违法。

红线 3:不能假冒名人代言

  • 用 AI 让"奥巴马""马斯克"代言你的产品 → 侵权 + 虚假宣传。
  • 即使做"恶搞"也要标注"AI 生成"。

7.2 平台合规要求

2026 年中国大陆相关法规要求:

  • AI 生成的视频必须显著标注:"AI 生成"或"虚拟人"或类似标识。
  • 数字人直播必须告知用户这是 AI 主播。
  • 不得用于违法用途(诈骗、色情、政治等)。

7.3 国际平台规则

  • YouTube:要求 AI 生成内容标注。
  • TikTok:AI 内容必须有 watermark(水印)。
  • Instagram / Meta:AI 标注政策。
  • C2PA 水印:行业标准的"AI 内容溯源水印",未来可能强制。

7.4 自查清单

发布数字人内容前,自查:

  • ☐ 是不是用了别人的脸/声音?(用了别人的 = 风险)
  • ☐ 有没有标注"AI 生成"?(没有 = 违规)
  • ☐ 内容是否真实?(虚假 = 违规)
  • ☐ 是否冒充他人?(冒充 = 违法)
  • ☐ 是否色情/政治/暴力?(是 = 严重违法)

八、本章小抄

  • 数字人 = 你 × N,是 AI 视频的核武器。
  • 4 种数字人:通用模板、自定义克隆、超写实、卡通。
  • 5 分钟克隆数字人:1 张照片 + 1 段录音 + 剪映 Pro / HeyGen。
  • 多语言数字人:HeyGen 让"你"讲 30+ 种语言。
  • 数字人直播:24 小时不停,适合标品;半人半机模式效果最好。
  • 8 种变现方式:知识口播、矩阵号、直播带货、企业服务、教育、出海、定制、IP 周边。
  • 3 条法律红线:不擅自克隆别人、不冒充欺骗、不假冒名人。
  • 平台合规:必须标注"AI 生成"。

5 分钟动手实验

任务

  • A. 用剪映免费数字人做一支"自我介绍" 30 秒视频。
  • B. 如果你有剪映 Pro:克隆你自己的数字人,做一支"自我介绍"。
  • C. 让你的数字人念一段你最熟悉的内容(你的工作介绍、你的兴趣领域),看效果。

进阶

  • 设计一个"虚拟 IP"(不是你自己),用 AI 画图工具先生成形象,再做成数字人。
  • 用 HeyGen 把你的视频翻译成英文版,看"你"讲英文是什么感觉。

下一章:第十二章 AI 视频工作流——从脚本到发布的完整流水线