ORANGE BOOK · AI ART

附录 D:术语表——用大白话解释 AI 绘画黑话


使用说明

  1. 按字母顺序排列(中文按拼音)
  2. 每个词包含:术语 + 大白话解释 + 举例(必要时)
  3. 重要术语会标注【★】(必看)

A 类

AI 绘画 【★】

用人工智能(AI)来生成图片的技术。 你描述一句话,AI 就给你画出来。

Aspect Ratio(宽高比)【★】

图片的"长宽比例"。

  • 1:1 = 正方形(朋友圈、头像)
  • 16:9 = 横屏(PPT、视频封面)
  • 9:16 = 竖屏(短视频、海报)
  • 3:4 = 略竖(小红书)
  • 4:3 = 略横(普通照片)

B 类

Batch(批量)

一次生成多张图。 比如"Batch=4"就是一次生成 4 张。

Blender

3D 建模软件,与 AI 绘画关系不大,但常被一起提到。


C 类

CFG / CFG Scale(引导强度)【★】

AI 听你话的"严格程度"。

  • 数值低(3-5):AI 自由发挥
  • 数值中(7-9):平衡(推荐)
  • 数值高(10-15):严格按你说的画

详见第六章。

Checkpoint(基础模型)

AI 绘画的"大模型"。 就像不同的"画家",每个 Checkpoint 风格不同。

常见的:

  • SD1.5、SDXL、SD3(Stable Diffusion 系列)
  • Midjourney V6、V7
  • Flux

Civitai

国际最大的 AI 模型分享网站。 里面有海量 Lora 和 Checkpoint 可下载。

ComfyUI

一种"节点式" AI 绘画工具。 界面像"流程图",专业玩家用。 对小白来说太复杂。

Controlnet(精确控制)

让你"精确控制"图的工具。 比如:上传一张姿势图,AI 按这个姿势画。 进阶玩家必备。

CLIP

AI 用来"理解文字"的模型。 你不需要知道细节,只要知道:CLIP 越好,AI 越懂你的提示词。


D 类

DALL-E 【★】

OpenAI 推出的 AI 绘画工具。 现在是 DALL-E 3,集成在 ChatGPT 里。 对长提示词理解最好。

Deepfake(深度伪造)

用 AI 换脸的技术。 违法警告:未经同意制作他人 Deepfake 是违法行为。

Diffusion Model(扩散模型)【★】

AI 绘画的核心技术原理。 大白话理解

  • 想象一张充满噪点的"雪花屏"
  • AI 一遍一遍"擦除"噪点
  • 直到呈现你想要的图

详见第一章。

DPM++ / DPM 2M

一种"采样算法"。 小白不需要知道细节,默认就行。


E 类

Embedding(嵌入)

一种"小型模型",用来记住特定特征。 比如:让 AI 记住"我女儿的样子"。 现在用 Lora 替代。


F 类

Face Restore(修脸)

AI 自动修复脸部扭曲。 大多数平台默认开启。

Flux

2024 年开源 AI 绘画大模型。 真实感强,目前是 SD 之外最强的开源模型。

FP16 / FP32

模型的"精度"。 小白不用关心,默认就行。


G 类

GAN(生成对抗网络)

早期的 AI 绘画技术。 现在被 Diffusion 模型替代。

GPT-4 / GPT-5

OpenAI 的语言模型。 不是绘画工具,但常被用来"写提示词"。


H 类

Hand Detailer / Hands Lora(修手)

专门修复 AI 画手错误的工具 / Lora。

High-Res Fix(高清修复)

把低分辨率图变成高分辨率的功能。 大多数平台都有。

HuggingFace

国际最大的 AI 模型平台。 偏技术,开发者用得多。


I 类

Img2Img(图生图)【★】

用一张图为基础,让 AI 在它的基础上画。 详见第七章。

Inpainting(局部重绘)【★】

只重新画图的"某一部分"。 比如:只重画错的手,其他不变。 详见第八章。

Ideogram

擅长画"文字"的 AI 工具。 LOGO、海报有文字时用它。


K 类

Krea

实时 AI 绘画工具。 你边写提示词边出图。 适合快速创意验证。

Krita

开源绘画软件。 现在集成了 AI 功能。


L 类

LCM(潜在一致性模型)

一种加速 AI 出图的技术。 原本要 30 秒,用 LCM 可能 3 秒。

Leonardo AI

游戏美术 AI 工具。 游戏开发者常用。

Liblib 【★】

中国最大的 AI 模型社区。 可以训练 Lora、下载模型。

LLM(大语言模型)

像 ChatGPT、豆包、文心一言。 不是绘画工具,但和 AI 绘画密切相关。

Lora 【★】

一种"小型微调模型"。 让 AI 学会某种特定风格 / 角色。

举例

  • "宫崎骏风格 Lora" = AI 学会宫崎骏的画风
  • "我女儿 Lora" = AI 学会画我女儿的样子

详见第八章。

Latent Space(潜在空间)

AI 内部的"思维空间"。 小白不需要知道细节。


M 类

Midjourney(MJ)【★】

国际最知名的 AI 绘画工具。 画面美学极高,最适合艺术创作。 价格 10-60 美元/月。

Model(模型)

AI 的"大脑"。 不同模型 = 不同画家。

MidJourney V7

Midjourney 2025 年发布的版本。 人物处理大幅提升。


N 类

Negative Prompt(负面词)【★】

告诉 AI"不要画"什么。 比如:"低质量, 模糊, 多余手指, 水印"。 每张图都建议加

详见第四章、第五章。


O 类

Outpainting(扩图)【★】

让 AI 把图"扩大"。 比如:竖图扩成横图。 详见第八章。

OpenAI

DALL-E 和 ChatGPT 的开发公司。


P 类

Photoshop(PS)

经典图像处理软件。 现在集成了 Adobe Firefly(AI 功能)。

Pose(姿势)

人物的姿势。 用 ControlNet 精确控制。

Pika

视频生成 AI 工具。

Prompt(提示词)【★】

你输入给 AI 的"指令"。 AI 绘画的核心。 详见第四章、第五章。

Prompt Engineering(提示词工程)

研究"怎么写好提示词"的学问。


Q 类

Quality(质量)

图的清晰度 / 精度。

  • Midjourney 的 --q 0.5 = 低质量(快但糙)
  • --q 1 = 标准
  • --q 2 = 高质量(慢但精)

详见第六章。


R 类

Recraft

专做矢量图、品牌设计的 AI 工具。

Resolution(分辨率)

图的像素大小。

  • 512×512 = 低
  • 1024×1024 = 标准
  • 2048×2048+ = 高

Runway

视频生成 / 编辑 AI 工具。


S 类

Sampler(采样器)

AI 出图的"算法"。 小白默认就行,进阶玩家会调。

常见:DPM++ 2M、Euler a、DDIM

Sampling Steps(采样步数)【★】

AI 画图的"细致程度"。

  • 步数低(10-15):快但粗糙
  • 步数中(20-30):平衡(推荐)
  • 步数高(40-100):精细但慢

详见第六章。

SD(Stable Diffusion)【★】

开源的 AI 绘画大模型。 免费、可本地部署、社区生态最好。 但有技术门槛。

Seed(种子)【★】

AI 出图的"随机数"。 同一种子 + 同提示词 = 几乎同一张图。 用来"重现"满意的图。

详见第五章、第六章。

Sora

OpenAI 的视频生成 AI。 质量目前国际最强。

SDXL

Stable Diffusion 的高级版。 出图质量比 SD1.5 好。

Style Transfer(风格迁移)

把 A 图的风格迁移到 B 图上。 图生图常用。

Stylize(风格化强度)【★】

Midjourney 的 --s 参数。 AI"自由发挥"的程度。 详见第六章。

Super Resolution(超分辨率)

把低分辨率图放大不糊的技术。


T 类

T2I(Text-to-Image,文生图)

用文字生成图。 最基本的 AI 绘画功能。

Text Prompt(文字提示词)

= Prompt(提示词)。

Tile(瓷砖式)

图的一种特殊模式:可以无缝拼接。 做壁纸常用。

Token(词元)

AI 计算的"单位"。 你写的提示词会被拆成 Token。 小白不用关心。

Topaz

专业图像放大软件。

Training(训练)

教 AI 学习某个新风格 / 新角色的过程。 训练 Lora 就是 Training。


U 类

Upscale(放大)

把图放大不糊。 Midjourney 出图后点 U1-U4。


V 类

V1, V2, V3...(版本号)

AI 模型的版本。 比如 Midjourney V7、SDXL、SD3。 版本越新通常效果越好。

VAE

模型的一个组件。 小白不用关心。

Variation(变体)

基于一张图生成"类似但不同"的版本。 Midjourney 出图后点 V1-V4。

Video Generation(视频生成)

AI 生成视频。 代表工具:Sora、可灵、Runway、Pika。


W 类

Waifu

二次元美少女的统称。 "Waifu Diffusion"是专门画二次元的模型。

Weight(权重)【★】

提示词中某个词的"重要程度"。

  • 默认 1
  • (red:1.5) = 红色权重 1.5(更强调)
  • (red:0.5) = 红色权重 0.5(更弱化)

详见第五章。

Workflow(工作流)

完成一个项目的"操作流程"。 ComfyUI 用节点图表示工作流。


X / Y / Z 类

XL(SDXL)

Stable Diffusion 的高级版本。

YAML

一种配置文件格式。 开发者用,小白不用。


中文专有名词

比例

= Aspect Ratio(宽高比)。

版权

谁拥有这张图的法律权利。 详见第十四章。

触发词

激活 Lora 的关键词。 比如:"训练好了一个'宫崎骏风格 Lora',触发词是 ghibli style"。 出图时不写这个词,Lora 就不起作用。

大模型

= Checkpoint(基础模型)。

垫图 【★】

= Reference Image(参考图)。 用一张图给 AI"打样"。 详见第七章。

多人 / 单人

提示词关键词。

  • "1 girl"、"solo" = 单人
  • "2 girls"、"group" = 多人

二次元

日漫风格。 "二次元 Lora"= 日漫风格的 Lora。

反向提示词 / 负面词 【★】

= Negative Prompt。

风格化

= Stylize。

高清修复

= High-Res Fix。

工作流 / 流水线

= Workflow。

古风

中国古代风格。 工具:文心一格擅长。

国风

中国传统美学风格。 水墨、工笔、青花瓷等。

国漫

中国动画风格。 代表作:《哪吒》《大圣归来》。

黑话

行业内的特殊用语。 比如本附录的所有术语都是"黑话"。

即梦 AI 【★】

字节跳动的 AI 绘画工具。 本书强力推荐的入门工具。

角色一致性 【★】

让同一个角色在多张图里"长得一样"。 绘本、漫画的核心需求。 详见第八章。

局部重绘 【★】

= Inpainting。

可灵 AI 【★】

快手的 AI 视频生成工具。 国内最强视频 AI。

蒙版

提示 AI"哪个区域要修改"的工具。 局部重绘时画出来的"白色区域"。

莫兰迪色

低饱和、高级感的色调。 现代设计极喜欢用。

跑图

AI 出图的口头表达。 "我跑了 100 张图才挑出 1 张满意的。"

平面图 / 立体图

平面 = 2D 插画 立体 = 3D 渲染

启动器

帮你"打开" Stable Diffusion 的工具。 代表:秋叶启动器(中文友好)。

参考强度

图生图的"听话程度"。

  • 低(30%):AI 改得多
  • 高(80%):AI 改得少

详见第七章。

设定图 / 概念图

某个角色 / 物品的"标准设计图"。

双胞胎 / 重复

AI 出错时常见现象: 画一个人结果出现 2-3 个相同的人。 解决:负面词加 "duplicate"。

算力

AI 出图需要的"计算资源"。 本地跑要好显卡,云端跑要付费。

提示词工程师

会写复杂提示词的人。 现在新兴职业之一。

通义万相

阿里的 AI 绘画工具。 电商场景强。

文生图 【★】

= T2I(Text-to-Image)。 用文字生成图。

文心一格

百度的 AI 绘画工具。 中文理解好,国风强。

修图

后期调整。 用美图秀秀、PS 等。

一致性

= 角色一致性。

引导强度

= CFG。

训练

= Training。

也图 / 嗯图

AI 圈口头语。

  • "也图"= 出新图
  • "嗯图"= 出图(拟声)

元素

构成图的"成分"。 人物、背景、道具、光线都是元素。

真实系 / 写实系

逼真的画风。 对应"二次元"。

重绘

= Inpainting(局部重绘)。

主体

图的"主角"。 提示词的核心。

字体

文字的样式。 AI 不擅长画字体,要后期加。

综合模型

包含多种风格的模型。 适合通用场景。


100 个高频术语速查表

术语 中文 用途
AI 绘画 AI Painting 用 AI 生成图
Prompt 提示词 给 AI 的指令
Negative Prompt 负面词 告诉 AI 不要画什么
Aspect Ratio 宽高比 控制图的比例
Img2Img 图生图 用图为基础
Inpainting 局部重绘 改图的某部分
Outpainting 扩图 把图扩大
Lora 小模型 学特定风格
Checkpoint 大模型 AI 的"画家身份"
Seed 种子 随机数控制
Stylize 风格化 AI 自由度
CFG 引导强度 AI 听话程度
Sampling Steps 采样步数 出图细致度
Quality 质量 图的精度
Resolution 分辨率 图的大小
Upscale 放大 高清化
Variation 变体 类似的图
Style Transfer 风格迁移 风格转换
Reference 参考图 给 AI 打样
Trigger Word 触发词 激活 Lora
Weight 权重 强调程度
Token 词元 提示词单位
Sampler 采样器 算法选择
Workflow 工作流 操作流程
Training 训练 教 AI 学新东西
Diffusion 扩散 AI 绘画原理
Latent 潜在 AI 内部空间
Embedding 嵌入 小型模型
ControlNet 精确控制 严格控图
Pose 姿势 人物姿势
Face Restore 修脸 修脸功能
High-Res Fix 高清修复 放大不糊
LCM 加速 快速出图
API 接口 程序调用
Batch 批量 一次多张
Tile 瓷砖 无缝拼接
Super Resolution 超分辨率 高清放大
Latent Space 潜在空间 AI 思维空间
Diffusion Model 扩散模型 AI 核心技术
GAN 对抗网络 早期 AI
VAE 一种组件 不用关心
FP16/FP32 精度 不用关心
YAML 配置文件 开发者用
HuggingFace AI 平台 偏技术
Civitai 国际社区 模型分享
Liblib 中国社区 模型分享
ComfyUI 工具 节点式
Stable Diffusion 开源大模型 免费可控
Midjourney 商业大模型 美学最强
DALL-E OpenAI 工具 集成 ChatGPT
Flux 新开源模型 2024 年最强
Sora 视频 AI 国际最强
即梦 AI 字节出品 入门首选
可灵 AI 快手出品 视频最强
文心一格 百度出品 国风强
通义万相 阿里出品 电商强
海艺 AI 中国社区 模型多
稿定 AI 设计工具 排版强
妙鸭相机 阿里出品 AI 写真
Recraft 矢量 AI 品牌设计
Leonardo 游戏 AI 游戏美术
Krea 实时 AI 创意验证
Ideogram 文字 AI 海报 LOGO
Adobe Firefly Adobe 出品 商用安全
Runway 视频 AI 专业创作
Pika 视频 AI 短视频
莫兰迪色 低饱和 高级感
二次元 日漫风 动漫风格
国风 中国传统 水墨工笔
国漫 中国动画 哪吒大圣
写实 真实风 摄影感
角色一致性 同人不变 绘本漫画
垫图 参考图 给 AI 打样
跑图 出图 口头表达
跑图机 出图设备 高性能电脑
算力 计算资源 本地或云端
启动器 工具 秋叶启动器
触发词 Lora 关键词 激活 Lora
大模型 Checkpoint AI 身份
小模型 Lora 风格补充
黑话 行话 本附录全是
翻车 失败 出图不好
调参 调整参数 优化设置
抠图 分离前景 后期处理
修图 后期调整 美化
调色 调整色彩 后期
排版 文字布局 后期
出片 完成作品 摄影术语
接单 接客户 商业
私单 个人定制 商业
公单 公司项目 商业
客单 客单价 商业
复购 重复购买 商业
引流 吸引客户 商业
私域 微信群 商业
公域 平台流量 商业
IP 知识产权 角色形象
VI 视觉识别 品牌设计
LOGO 标识 品牌设计
Banner 横幅 设计术语
主图 商品主图 电商
详情图 商品详情 电商
头图 顶部图 设计

本附录小结

  1. AI 绘画"黑话"很多:但 80% 的术语小白不必懂。
  2. 必看的 20 个术语(标注了★):先掌握这些就能上手。
  3. 遇到看不懂的词:来这里查一查。
  4. 不要被术语吓到:能"输入提示词、按生成"就是入门。

持续更新:AI 绘画术语在不断演变,本附录会随着行业发展持续补充。