术语表用大白话解释AI绘画黑话 · AI 绘画橙皮书

使用说明

按字母顺序排列（中文按拼音）
每个词包含：术语 + 大白话解释 + 举例（必要时）
重要术语会标注【★】（必看）

A 类

AI 绘画【★】

用人工智能（AI）来生成图片的技术。你描述一句话，AI 就给你画出来。

Aspect Ratio（宽高比）【★】

图片的"长宽比例"。

1:1 = 正方形（朋友圈、头像）
16:9 = 横屏（PPT、视频封面）
9:16 = 竖屏（短视频、海报）
3:4 = 略竖（小红书）
4:3 = 略横（普通照片）

B 类

Batch（批量）

一次生成多张图。比如"Batch=4"就是一次生成 4 张。

Blender

3D 建模软件，与 AI 绘画关系不大，但常被一起提到。

C 类

CFG / CFG Scale（引导强度）【★】

AI 听你话的"严格程度"。

数值低（3-5）：AI 自由发挥
数值中（7-9）：平衡（推荐）
数值高（10-15）：严格按你说的画

详见第六章。

Checkpoint（基础模型）

AI 绘画的"大模型"。就像不同的"画家"，每个 Checkpoint 风格不同。

常见的：

SD1.5、SDXL、SD3（Stable Diffusion 系列）
Midjourney V6、V7
Flux

Civitai

国际最大的 AI 模型分享网站。里面有海量 Lora 和 Checkpoint 可下载。

ComfyUI

一种"节点式" AI 绘画工具。界面像"流程图"，专业玩家用。对小白来说太复杂。

Controlnet（精确控制）

让你"精确控制"图的工具。比如：上传一张姿势图，AI 按这个姿势画。进阶玩家必备。

CLIP

AI 用来"理解文字"的模型。你不需要知道细节，只要知道：CLIP 越好，AI 越懂你的提示词。

D 类

DALL-E 【★】

OpenAI 推出的 AI 绘画工具。现在是 DALL-E 3，集成在 ChatGPT 里。对长提示词理解最好。

Deepfake（深度伪造）

用 AI 换脸的技术。 违法警告：未经同意制作他人 Deepfake 是违法行为。

Diffusion Model（扩散模型）【★】

AI 绘画的核心技术原理。 大白话理解：

想象一张充满噪点的"雪花屏"
AI 一遍一遍"擦除"噪点
直到呈现你想要的图

详见第一章。

DPM++ / DPM 2M

一种"采样算法"。小白不需要知道细节，默认就行。

E 类

Embedding（嵌入）

一种"小型模型"，用来记住特定特征。比如：让 AI 记住"我女儿的样子"。现在用 Lora 替代。

F 类

Face Restore（修脸）

AI 自动修复脸部扭曲。大多数平台默认开启。

Flux

2024 年开源 AI 绘画大模型。真实感强，目前是 SD 之外最强的开源模型。

FP16 / FP32

模型的"精度"。小白不用关心，默认就行。

G 类

GAN（生成对抗网络）

早期的 AI 绘画技术。现在被 Diffusion 模型替代。

GPT-4 / GPT-5

OpenAI 的语言模型。不是绘画工具，但常被用来"写提示词"。

H 类

Hand Detailer / Hands Lora（修手）

专门修复 AI 画手错误的工具 / Lora。

High-Res Fix（高清修复）

把低分辨率图变成高分辨率的功能。大多数平台都有。

HuggingFace

国际最大的 AI 模型平台。偏技术，开发者用得多。

I 类

Img2Img（图生图）【★】

用一张图为基础，让 AI 在它的基础上画。详见第七章。

Inpainting（局部重绘）【★】

只重新画图的"某一部分"。比如：只重画错的手，其他不变。详见第八章。

Ideogram

擅长画"文字"的 AI 工具。 LOGO、海报有文字时用它。

K 类

Krea

实时 AI 绘画工具。你边写提示词边出图。适合快速创意验证。

Krita

开源绘画软件。现在集成了 AI 功能。

L 类

LCM（潜在一致性模型）

一种加速 AI 出图的技术。原本要 30 秒，用 LCM 可能 3 秒。

Leonardo AI

游戏美术 AI 工具。游戏开发者常用。

Liblib 【★】

中国最大的 AI 模型社区。可以训练 Lora、下载模型。

LLM（大语言模型）

像 ChatGPT、豆包、文心一言。不是绘画工具，但和 AI 绘画密切相关。

Lora 【★】

一种"小型微调模型"。让 AI 学会某种特定风格 / 角色。

举例：

"宫崎骏风格 Lora" = AI 学会宫崎骏的画风
"我女儿 Lora" = AI 学会画我女儿的样子

详见第八章。

Latent Space（潜在空间）

AI 内部的"思维空间"。小白不需要知道细节。

M 类

Midjourney（MJ）【★】

国际最知名的 AI 绘画工具。画面美学极高，最适合艺术创作。价格 10-60 美元/月。

Model（模型）

AI 的"大脑"。不同模型 = 不同画家。

MidJourney V7

Midjourney 2025 年发布的版本。人物处理大幅提升。

N 类

Negative Prompt（负面词）【★】

告诉 AI"不要画"什么。比如："低质量, 模糊, 多余手指, 水印"。 每张图都建议加。

详见第四章、第五章。

O 类

Outpainting（扩图）【★】

让 AI 把图"扩大"。比如：竖图扩成横图。详见第八章。

OpenAI

DALL-E 和 ChatGPT 的开发公司。

P 类

Photoshop（PS）

经典图像处理软件。现在集成了 Adobe Firefly（AI 功能）。

Pose（姿势）

人物的姿势。用 ControlNet 精确控制。

Pika

视频生成 AI 工具。

Prompt（提示词）【★】

你输入给 AI 的"指令"。 AI 绘画的核心。详见第四章、第五章。

Prompt Engineering（提示词工程）

研究"怎么写好提示词"的学问。

Q 类

Quality（质量）

图的清晰度 / 精度。

Midjourney 的 --q 0.5 = 低质量（快但糙）
--q 1 = 标准
--q 2 = 高质量（慢但精）

详见第六章。

R 类

Recraft

专做矢量图、品牌设计的 AI 工具。

Resolution（分辨率）

图的像素大小。

512×512 = 低
1024×1024 = 标准
2048×2048+ = 高

Runway

视频生成 / 编辑 AI 工具。

S 类

Sampler（采样器）

AI 出图的"算法"。小白默认就行，进阶玩家会调。

常见：DPM++ 2M、Euler a、DDIM

Sampling Steps（采样步数）【★】

AI 画图的"细致程度"。

步数低（10-15）：快但粗糙
步数中（20-30）：平衡（推荐）
步数高（40-100）：精细但慢

详见第六章。

SD（Stable Diffusion）【★】

开源的 AI 绘画大模型。免费、可本地部署、社区生态最好。但有技术门槛。

Seed（种子）【★】

AI 出图的"随机数"。 同一种子 + 同提示词 = 几乎同一张图。用来"重现"满意的图。

详见第五章、第六章。

Sora

OpenAI 的视频生成 AI。质量目前国际最强。

SDXL

Stable Diffusion 的高级版。出图质量比 SD1.5 好。

Style Transfer（风格迁移）

把 A 图的风格迁移到 B 图上。图生图常用。

Stylize（风格化强度）【★】

Midjourney 的 --s 参数。 AI"自由发挥"的程度。详见第六章。

Super Resolution（超分辨率）

把低分辨率图放大不糊的技术。

T 类

T2I（Text-to-Image，文生图）

用文字生成图。最基本的 AI 绘画功能。

Text Prompt（文字提示词）

= Prompt（提示词）。

Tile（瓷砖式）

图的一种特殊模式：可以无缝拼接。做壁纸常用。

Token（词元）

AI 计算的"单位"。你写的提示词会被拆成 Token。小白不用关心。

Topaz

专业图像放大软件。

Training（训练）

教 AI 学习某个新风格 / 新角色的过程。训练 Lora 就是 Training。

U 类

Upscale（放大）

把图放大不糊。 Midjourney 出图后点 U1-U4。

V 类

V1, V2, V3...（版本号）

AI 模型的版本。比如 Midjourney V7、SDXL、SD3。版本越新通常效果越好。

VAE

模型的一个组件。小白不用关心。

Variation（变体）

基于一张图生成"类似但不同"的版本。 Midjourney 出图后点 V1-V4。

Video Generation（视频生成）

AI 生成视频。代表工具：Sora、可灵、Runway、Pika。

W 类

Waifu

二次元美少女的统称。 "Waifu Diffusion"是专门画二次元的模型。

Weight（权重）【★】

提示词中某个词的"重要程度"。

默认 1
(red:1.5) = 红色权重 1.5（更强调）
(red:0.5) = 红色权重 0.5（更弱化）

详见第五章。

Workflow（工作流）

完成一个项目的"操作流程"。 ComfyUI 用节点图表示工作流。

X / Y / Z 类

XL（SDXL）

Stable Diffusion 的高级版本。

YAML

一种配置文件格式。开发者用，小白不用。

中文专有名词

比例

= Aspect Ratio（宽高比）。

版权

谁拥有这张图的法律权利。详见第十四章。

触发词

激活 Lora 的关键词。比如："训练好了一个'宫崎骏风格 Lora'，触发词是 ghibli style"。出图时不写这个词，Lora 就不起作用。

大模型

= Checkpoint（基础模型）。

垫图【★】

= Reference Image（参考图）。用一张图给 AI"打样"。详见第七章。

多人 / 单人

提示词关键词。

"1 girl"、"solo" = 单人
"2 girls"、"group" = 多人

二次元

日漫风格。 "二次元 Lora"= 日漫风格的 Lora。

反向提示词 / 负面词【★】

= Negative Prompt。

风格化

= Stylize。

高清修复

= High-Res Fix。

工作流 / 流水线

= Workflow。

古风

中国古代风格。工具：文心一格擅长。

国风

中国传统美学风格。水墨、工笔、青花瓷等。

国漫

中国动画风格。代表作：《哪吒》《大圣归来》。

黑话

行业内的特殊用语。比如本附录的所有术语都是"黑话"。

即梦 AI 【★】

字节跳动的 AI 绘画工具。本书强力推荐的入门工具。

角色一致性【★】

让同一个角色在多张图里"长得一样"。绘本、漫画的核心需求。详见第八章。

局部重绘【★】

= Inpainting。

可灵 AI 【★】

快手的 AI 视频生成工具。国内最强视频 AI。

蒙版

提示 AI"哪个区域要修改"的工具。局部重绘时画出来的"白色区域"。

莫兰迪色

低饱和、高级感的色调。现代设计极喜欢用。

跑图

AI 出图的口头表达。 "我跑了 100 张图才挑出 1 张满意的。"

平面图 / 立体图

平面 = 2D 插画立体 = 3D 渲染

启动器

帮你"打开" Stable Diffusion 的工具。代表：秋叶启动器（中文友好）。

参考强度

图生图的"听话程度"。

低（30%）：AI 改得多
高（80%）：AI 改得少

详见第七章。

设定图 / 概念图

某个角色 / 物品的"标准设计图"。

双胞胎 / 重复

AI 出错时常见现象：画一个人结果出现 2-3 个相同的人。解决：负面词加 "duplicate"。

算力

AI 出图需要的"计算资源"。本地跑要好显卡，云端跑要付费。

提示词工程师

会写复杂提示词的人。现在新兴职业之一。

通义万相

阿里的 AI 绘画工具。电商场景强。

文生图【★】

= T2I（Text-to-Image）。用文字生成图。

文心一格

百度的 AI 绘画工具。中文理解好，国风强。

修图

后期调整。用美图秀秀、PS 等。

一致性

= 角色一致性。

引导强度

= CFG。

训练

= Training。

也图 / 嗯图

AI 圈口头语。

"也图"= 出新图
"嗯图"= 出图（拟声）

元素

构成图的"成分"。人物、背景、道具、光线都是元素。

真实系 / 写实系

逼真的画风。对应"二次元"。

重绘

= Inpainting（局部重绘）。

主体

图的"主角"。提示词的核心。

字体

文字的样式。 AI 不擅长画字体，要后期加。

综合模型

包含多种风格的模型。适合通用场景。

100 个高频术语速查表

术语	中文	用途
AI 绘画	AI Painting	用 AI 生成图
Prompt	提示词	给 AI 的指令
Negative Prompt	负面词	告诉 AI 不要画什么
Aspect Ratio	宽高比	控制图的比例
Img2Img	图生图	用图为基础
Inpainting	局部重绘	改图的某部分
Outpainting	扩图	把图扩大
Lora	小模型	学特定风格
Checkpoint	大模型	AI 的"画家身份"
Seed	种子	随机数控制
Stylize	风格化	AI 自由度
CFG	引导强度	AI 听话程度
Sampling Steps	采样步数	出图细致度
Quality	质量	图的精度
Resolution	分辨率	图的大小
Upscale	放大	高清化
Variation	变体	类似的图
Style Transfer	风格迁移	风格转换
Reference	参考图	给 AI 打样
Trigger Word	触发词	激活 Lora
Weight	权重	强调程度
Token	词元	提示词单位
Sampler	采样器	算法选择
Workflow	工作流	操作流程
Training	训练	教 AI 学新东西
Diffusion	扩散	AI 绘画原理
Latent	潜在	AI 内部空间
Embedding	嵌入	小型模型
ControlNet	精确控制	严格控图
Pose	姿势	人物姿势
Face Restore	修脸	修脸功能
High-Res Fix	高清修复	放大不糊
LCM	加速	快速出图
API	接口	程序调用
Batch	批量	一次多张
Tile	瓷砖	无缝拼接
Super Resolution	超分辨率	高清放大
Latent Space	潜在空间	AI 思维空间
Diffusion Model	扩散模型	AI 核心技术
GAN	对抗网络	早期 AI
VAE	一种组件	不用关心
FP16/FP32	精度	不用关心
YAML	配置文件	开发者用
HuggingFace	AI 平台	偏技术
Civitai	国际社区	模型分享
Liblib	中国社区	模型分享
ComfyUI	工具	节点式
Stable Diffusion	开源大模型	免费可控
Midjourney	商业大模型	美学最强
DALL-E	OpenAI 工具	集成 ChatGPT
Flux	新开源模型	2024 年最强
Sora	视频 AI	国际最强
即梦 AI	字节出品	入门首选
可灵 AI	快手出品	视频最强
文心一格	百度出品	国风强
通义万相	阿里出品	电商强
海艺 AI	中国社区	模型多
稿定 AI	设计工具	排版强
妙鸭相机	阿里出品	AI 写真
Recraft	矢量 AI	品牌设计
Leonardo	游戏 AI	游戏美术
Krea	实时 AI	创意验证
Ideogram	文字 AI	海报 LOGO
Adobe Firefly	Adobe 出品	商用安全
Runway	视频 AI	专业创作
Pika	视频 AI	短视频
莫兰迪色	低饱和	高级感
二次元	日漫风	动漫风格
国风	中国传统	水墨工笔
国漫	中国动画	哪吒大圣
写实	真实风	摄影感
角色一致性	同人不变	绘本漫画
垫图	参考图	给 AI 打样
跑图	出图	口头表达
跑图机	出图设备	高性能电脑
算力	计算资源	本地或云端
启动器	工具	秋叶启动器
触发词	Lora 关键词	激活 Lora
大模型	Checkpoint	AI 身份
小模型	Lora	风格补充
黑话	行话	本附录全是
翻车	失败	出图不好
调参	调整参数	优化设置
抠图	分离前景	后期处理
修图	后期调整	美化
调色	调整色彩	后期
排版	文字布局	后期
出片	完成作品	摄影术语
接单	接客户	商业
私单	个人定制	商业
公单	公司项目	商业
客单	客单价	商业
复购	重复购买	商业
引流	吸引客户	商业
私域	微信群	商业
公域	平台流量	商业
IP	知识产权	角色形象
VI	视觉识别	品牌设计
LOGO	标识	品牌设计
Banner	横幅	设计术语
主图	商品主图	电商
详情图	商品详情	电商
头图	顶部图	设计

本附录小结

AI 绘画"黑话"很多：但 80% 的术语小白不必懂。

必看的 20 个术语（标注了★）：先掌握这些就能上手。

遇到看不懂的词：来这里查一查。

不要被术语吓到：能"输入提示词、按生成"就是入门。

持续更新：AI 绘画术语在不断演变，本附录会随着行业发展持续补充。

附录 D：术语表——用大白话解释 AI 绘画黑话

使用说明

A 类

AI 绘画 【★】

Aspect Ratio（宽高比）【★】

B 类

Batch（批量）

Blender

C 类

CFG / CFG Scale（引导强度）【★】

Checkpoint（基础模型）

Civitai

ComfyUI

Controlnet（精确控制）

CLIP

D 类

DALL-E 【★】

Deepfake（深度伪造）

Diffusion Model（扩散模型）【★】

DPM++ / DPM 2M

E 类

Embedding（嵌入）

F 类

Face Restore（修脸）

Flux

FP16 / FP32

G 类

GAN（生成对抗网络）

GPT-4 / GPT-5

H 类

Hand Detailer / Hands Lora（修手）

High-Res Fix（高清修复）

HuggingFace

I 类

Img2Img（图生图）【★】

Inpainting（局部重绘）【★】

Ideogram

K 类

Krea

Krita

L 类

LCM（潜在一致性模型）

Leonardo AI

Liblib 【★】

LLM（大语言模型）

Lora 【★】

Latent Space（潜在空间）

M 类

Midjourney（MJ）【★】

Model（模型）

MidJourney V7

N 类

Negative Prompt（负面词）【★】

O 类

Outpainting（扩图）【★】

OpenAI

P 类

Photoshop（PS）

Pose（姿势）

Pika

Prompt（提示词）【★】

Prompt Engineering（提示词工程）

Q 类

Quality（质量）

R 类

Recraft

Resolution（分辨率）

Runway

S 类

Sampler（采样器）

Sampling Steps（采样步数）【★】

SD（Stable Diffusion）【★】

Seed（种子）【★】

Sora

SDXL

Style Transfer（风格迁移）

Stylize（风格化强度）【★】

Super Resolution（超分辨率）

T 类

T2I（Text-to-Image，文生图）

AI 绘画【★】

垫图【★】

反向提示词 / 负面词【★】

角色一致性【★】

局部重绘【★】

文生图【★】