| 项 | 信息 |
|---|---|
| 当前版本 | v1.0.0 |
| 最后更新 | 2026-04-19 |
| 收录领域 | 10 大行业领域 |
| 收录场景 | 80+ 物理场景 / 业务单元 |
| 收录情境 | 320+ 情境 |
| 收录任务 | 1000+ 任务 |
| 收录动作 | 5000+ 原子动作(附录 B 精选 3000) |
| 适配设备 | FastUMI Ego/Pro/Go、Project Aria、Meta Glasses、智元手环、星动腕带、京东背包等主流设备 |
| 语言 | 简体中文 |
| 许可协议 | CC BY-SA 4.0(署名 + 相同方式共享) |
| 反馈 / 勘误 | 在仓库提 Issue,或邮件至 book@egolist.community |
如何使用本书:本书允许你免费下载、传播、翻译、改编,但必须署名作者并保持相同协议开源,禁止任何形式的"封装售卖"或"去名转售"。
这本书是写给谁的
- 完全没听过"EGO 数采""第一人称数据采集",但听说有人靠戴眼镜做家务一小时挣 100 块的人。
- 已经在做采集员,但每次接到任务只知道"做这个动作",不知道这个动作在整个产业图谱里"位于哪里、为什么有人要"的人。
- 想转行做采集员,但不知道自己擅长哪个场景、哪个场景门槛最低、哪个场景报酬最高的人。
- 想做"采集基地""采集众包""数据超市"的小老板、产业园招商负责人、转型者,需要一份"行业全图"做产品规划的人。
- 数据公司的产品经理、运营、销售,想梳理自己平台"还能上哪些 SKU"的人。
- 机器人公司的算法、产品、售前,想找"我这个模型缺什么场景的数据"的人。
- 投资人、行业研究员、政策制定者、媒体记者,需要一张"全景地图"快速理解这个 2026 年最热行业的人。
- 高校老师、培训机构、职业学校,需要一份"教学大纲蓝本"教学生入门的人。
如果你属于以上任何一类,你来对地方了。
这本书不是什么
- 不是 SDK 文档、不是 API 参考、不是任何具体设备的说明书。
- 不是面向算法工程师的"模型训练指南"。
- 不是堆术语、堆参数、堆截图的"产品手册"。
- 不是"哪家公司更好"的厂商对比,我们对所有玩家保持中立。
它是一本场景百科全书 + 领域工作手册。每一页都告诉你"这个场景里到底有什么任务、每个任务里到底有什么动作、为什么这些动作值得被记录"。
为什么需要一本"场景百科"
2026 年的 EGO 数采行业,正在重演 2008-2012 年"数据标注行业"的历史,但比那次更宏大:
- 它是一个万亿级行业的最底层——人形机器人量产之前,必须经过"千万小时第一人称数据"的喂养。
- 它的劳动力来源是"普通人"——不需要懂 AI、不需要懂代码,能做家务、能炒菜、能跑外卖、能开车的人,就是这个行业的"产业工人"。
- 它最稀缺的从来不是"动作",而是"场景的多样性"——同一个"开门"动作,在病房、在车间、在酒店客房、在火锅店后厨,都是不同价值的训练样本。
但是——整个行业到现在都没有一份公开的、完整的、面向普通人的"场景全图"。
公司各自有内部清单,平台各自有自己的 SKU 命名,论文用一套术语,招标文件用另一套术语,普通人想看懂"这个行业到底有多少种活儿可干",无从下手。
这本书就要补这个空白。
我们不发明新词,不引战术,不站队厂商,只做一件事:把全行业公开可见的 EGO 数采场景,按"领域→场景→情境→任务→动作"5 层装进一棵大树里,让任何人都能在 1 分钟内找到"我关心的那个场景在哪一页"。
你将获得什么
读完整本书,你会:
- 真正理解"EGO 数采"这件事,能在 5 分钟内向任何人讲清楚(哪怕对方完全没听过)。
- 完全掌握"领域-场景-情境-任务-动作"5 层架构这套通用语言——和任何采集公司、机器人公司、数据平台沟通时不再"鸡同鸭讲"。
- 看懂全行业 10 大领域、80+ 场景的全景图,知道自己的生活和工作经验适合做哪些场景的采集。
- 拿到 1000+ 任务清单 + 5000+ 原子动作分解,可以直接对照下单、报价、立项、培训、考核。
- 学会"场景画像 / 情境画像 / 任务画像"三件套写法,能为自己接的每一单数据写出符合行业惯例的元数据。
- 知道每个场景对应的硬件设备怎么选、合规要求是什么、隐私分级如何评估、数据交付物长什么样。
- 知道如何把一个"我会做的事"扩展成一个"持续接单的小生意"——附录 E 提供了完整的"新场景提案模板"。
- 看懂未来 5 年新兴的、下一代的、目前还在实验室的"未来场景",提前卡位。
阅读路径建议
这本书一共 1 个卷首语 + 6 篇正文 + 6 个附录,全书约 30 万字。你不必从头读到尾,下面几条路径任选其一。
路径 A:完全外行(推荐)
按章节顺序从 00 卷首语 一路读到 22 拓展篇,每篇看完再翻附录。预计 1 个周末看完,建立完整认知。
路径 B:已经做采集,想找新场景
路径 C:开数据公司 / 开采集基地
路径 D:算法 / 产品经理找数据缺口
路径 E:投资人 / 研究员 / 媒体
- 00 卷首语 + 01 导论 + 22 拓展篇 + 附录 F 30 问 FAQ,2 小时建立"行业 BP 级"认知。
完整目录
| 章节 | 你会得到 |
|---|---|
| 00 卷首语:为什么需要一本场景百科 | 一封给"采集员、企业、所有路人"的开场信,看完知道这本书能帮你解决什么 |
| 01 第一篇 导论:给完全陌生用户的 5 分钟入门 | EGO 数采是什么、和拍 Vlog 的区别、为什么要分场景、5 层架构的"一图速览" |
| 02 第二篇 架构:5 层场景体系到底是什么 | 领域/场景/情境/任务/动作的精确定义、ID 编码规则、5 个完整范例对照 |
| 03 第三篇 全图:10 大领域速览与选择决策树 | 一图看完所有领域、选择决策树(你适合哪个)、领域热度与单价对照表 |
| 10 领域一·家庭生活 | 厨房 / 客厅 / 卧室 / 卫浴 / 阳台 / 餐厅 / 玄关 / 书房 / 车库共 9 场景 |
| 11 领域二·餐饮服务 | 后厨 / 前厅 / 外卖 / 咖啡馆 / 茶饮 / 烧烤 / 火锅 / 中央厨房共 8 场景 |
| 12 领域三·工业生产装配 | 来料 / 上料 / 装配 / 拧紧 / 焊接 / 贴装 / 质检 / 包装 / 入库共 9 场景 |
| 13 领域四·物流仓储 | 入库 / 分拣 / 拣选 / 打包 / 出库 / 末端配送 / 退货 / 盘点共 8 场景 |
| 14 领域五·商业零售与陈列 | 上架 / 补货 / 理货 / 收银 / 试衣 / 退换 / 防损 / 盘点共 8 场景 |
| 15 领域六·酒店服务 | 前台 / 客房 / 餐饮 / 会务 / SPA / 泊车 / 行李 / 夜审共 8 场景 |
| 16 领域七·医疗护理与康养 | 接诊 / 给药 / 康复 / 护理 / 手术辅助 / 院感 / 居家照护共 7 场景 |
| 17 领域八·教育场景 | 幼教 / K12 / 职教实训 / 科学实验 / 特殊教育 / 家庭辅导共 6 场景 |
| 18 领域九·特种作业 | 高空 / 电力 / 化工 / 消防 / 应急 / 野外勘测 / 水下 / 夜班共 8 场景 |
| 19 领域十·专业科研与文创 | 实验室 / 野外科考 / 手工艺 / 3D 打印 / 影视 / 医美 / 兽医共 7 场景 |
| 20 第四篇 实战:从场景手册到项目立项 | 怎样从这本书的目录里找到一个具体场景、立项、报价、交付 |
| 21 第五篇 治理:命名编码与版本演进 | 5 层 ID 编码、版本号策略、场景废弃流程、与公司内部 SKU 系统的对接 |
| 22 第六篇 拓展:AGI 时代的新兴场景与下一代领域 | 太空 / 农业 / 公共安全 / 心理疗愈 / 元宇宙等 8 个未来场景 |
| 附录 A 全部领域-场景-情境总目录 | 1000+ 任务一页查的"地图册" |
| 附录 B 3000 原子动作清单 | 手部 / 头部 / 移动 / 工具四大类完整清单 |
| 附录 C 场景-硬件适配速查表 | 每个场景对应"必备 / 推荐 / 可选"硬件 |
| 附录 D 合规与隐私分级表 | 5 级合规风险(L0–L4)、场景分级总表、关键法规与同意书要素 |
| 附录 E 新场景提案模板与社区贡献指南 | 提案模板、PR 流程、命名审查清单 |
| 附录 F 30 问场景 FAQ | 30 个最常被问的问题集中解答 |
如何使用这本书
- 先看「30 秒导读」:每一篇 / 每一章开头都有 30 秒就能读完的导读,告诉你这章在解决什么问题、做完会得到什么。如果不感兴趣,可以直接跳过。
- 认领一个场景,跟着做一遍:所有领域章都按"场景画像 → 典型情境 → 任务清单 → 原子动作分解 → 采集要点 → 合规提示 → 数据交付物"7 段式展开,建议挑你最熟悉的一个场景,从头到尾走一遍。
- 对照「本章一图回顾」:章末的小结帮你把这章的"领域 → 场景 → 情境 → 任务 → 动作"串成一棵小树,方便日后翻查。
- 遇到术语先翻附录:80% 的常见疑问都收录在 附录 F 30 问场景 FAQ 里。
本书使用约定
5 层 ID 命名规范
全书用一套统一的 5 段式 ID 标注每一个原子动作,例如:
D01-S03-C02-T05-A12 = "领域 01(家庭)· 场景 03(厨房)· 情境 02(早餐准备)· 任务 05(煎鸡蛋)· 动作 12(翻面)"
| 层级 | 缩写 | 编号位数 | 例子 | 含义 |
|---|---|---|---|---|
| 领域 Domain | D | 2 位 | D01 | 家庭生活 |
| 场景 Scene | S | 2 位 | S03 | 厨房 |
| 情境 Context | C | 2 位 | C02 | 早餐准备 |
| 任务 Task | T | 2 位 | T05 | 煎鸡蛋 |
| 动作 Action | A | 2 位 | A12 | 翻面 |
ID 系统对企业的好处:可以直接拿来做内部 SKU、订单号、数据集目录结构。
排版约定
代码块:可以直接复制使用的命令、配置、提示词。- 「引号」:界面上的按钮、菜单或选项名称。
- 粗体:值得你停下来重点理解的关键词。
- 表格中的"难度"统一用 ★(1-5 星)表示,"单价"参考 2026 年 4 月公开市价中位数。
- 场景合规风险分级以 L0–L4 为主表(详见 附录 D);部分领域章正文会用 P0–P3 表示画面隐私敏感度,与 L 级并行使用、含义不同。
本书风格的小约定
- 我们假设你不是数据科学家,但愿意学一点点新东西。所有名词第一次出现都给"白话解释"。
- 我们不会让你"先理解原理再动手",恰恰相反,我们让你先看到一个具体场景,再回头讲为什么。
- 我们不会推荐"一定要用某家公司的设备"。每一个场景的硬件清单都给出通用规格 + 至少 2 家厂商做参考。
- 我们也不会假装"这个行业完美无缺"。第十八章 特种作业 和 附录 D 会老老实实告诉你哪些场景目前不该碰。
一句话总结
这本书要做的事情只有一件:把"机器人需要被人教会的所有事",按 5 层架构一次列清楚,让你知道自己能教它什么、教它有人买单。
准备好了吗?翻开 00 卷首语 开始吧。
配套书籍:完整的 EGO 三部曲
本书是 EGO 三部曲中的"场景卷",与另外两本书互补:
| 书 | 写给谁 | 侧重 |
|---|---|---|
| 《第一人称数据采集(Ego)行业橙皮书:入门与入行指南》 | 想做采集员的个人 | "我个人怎么入行、怎么挣到第一个 1 万元" |
| 《Ego 数据采集企业橙皮书:企业入局实战指南》 | 企业主、投资人 | "我公司怎么进场、怎么算账、怎么避坑" |
| 《EGO 数采场景橙皮书:分层场景百科全书》(本书) | 所有人 | "全行业到底有哪些场景,按 5 层架构一次梳理清楚" |
三本书可以单独阅读,但合起来组成完整的"EGO 数采全景图书馆"。
版本与变更
| 版本 | 日期 | 主要变更 |
|---|---|---|
| v1.0.0 | 2026-04-19 | 初版发布:6 篇正文 + 10 个领域章 + 6 个附录,覆盖 80+ 场景、1000+ 任务、5000+ 动作 |
后续如有新增 / 勘误,会在本表追加,并在每章相关段落加
(v1.x 更新)标注。我们会按季度发布新版本,跟随行业新场景同步增补。
版权与署名
- 本书根据 CC BY-SA 4.0 协议开源,欢迎转载、翻译、改编。
- 转载请注明原书《EGO 数采场景橙皮书:分层场景百科全书》及原始仓库地址。
- 改编版本必须保持同一协议开源。
- 商业用途(如纳入付费课程、纸质出版、收费社群)请先联系作者邮箱获取授权。
如果这本书帮到了你,最好的"赞赏"就是把它转发给一位还在迷茫"我能不能去做数采"的朋友——也许他下个月就因为你这个动作,找到了人生的下一份工作。