ORANGE BOOK · EGO

EGO数采橙皮书第一人称数据采集场景百科

信息
当前版本 v1.0.0
最后更新 2026-04-19
收录领域 10 大行业领域
收录场景 80+ 物理场景 / 业务单元
收录情境 320+ 情境
收录任务 1000+ 任务
收录动作 5000+ 原子动作(附录 B 精选 3000)
适配设备 FastUMI Ego/Pro/Go、Project Aria、Meta Glasses、智元手环、星动腕带、京东背包等主流设备
语言 简体中文
许可协议 CC BY-SA 4.0(署名 + 相同方式共享)
反馈 / 勘误 在仓库提 Issue,或邮件至 book@egolist.community

如何使用本书:本书允许你免费下载、传播、翻译、改编,但必须署名作者并保持相同协议开源,禁止任何形式的"封装售卖"或"去名转售"。


这本书是写给谁的

  • 完全没听过"EGO 数采""第一人称数据采集",但听说有人靠戴眼镜做家务一小时挣 100 块的人。
  • 已经在做采集员,但每次接到任务只知道"做这个动作",不知道这个动作在整个产业图谱里"位于哪里、为什么有人要"的人。
  • 想转行做采集员,但不知道自己擅长哪个场景、哪个场景门槛最低、哪个场景报酬最高的人。
  • 想做"采集基地""采集众包""数据超市"的小老板、产业园招商负责人、转型者,需要一份"行业全图"做产品规划的人。
  • 数据公司的产品经理、运营、销售,想梳理自己平台"还能上哪些 SKU"的人。
  • 机器人公司的算法、产品、售前,想找"我这个模型缺什么场景的数据"的人。
  • 投资人、行业研究员、政策制定者、媒体记者,需要一张"全景地图"快速理解这个 2026 年最热行业的人。
  • 高校老师、培训机构、职业学校,需要一份"教学大纲蓝本"教学生入门的人。

如果你属于以上任何一类,你来对地方了。

这本书不是什么

  • 不是 SDK 文档、不是 API 参考、不是任何具体设备的说明书。
  • 不是面向算法工程师的"模型训练指南"。
  • 不是堆术语、堆参数、堆截图的"产品手册"。
  • 不是"哪家公司更好"的厂商对比,我们对所有玩家保持中立。

它是一本场景百科全书 + 领域工作手册。每一页都告诉你"这个场景里到底有什么任务、每个任务里到底有什么动作、为什么这些动作值得被记录"。

为什么需要一本"场景百科"

2026 年的 EGO 数采行业,正在重演 2008-2012 年"数据标注行业"的历史,但比那次更宏大:

  1. 它是一个万亿级行业的最底层——人形机器人量产之前,必须经过"千万小时第一人称数据"的喂养。
  2. 它的劳动力来源是"普通人"——不需要懂 AI、不需要懂代码,能做家务、能炒菜、能跑外卖、能开车的人,就是这个行业的"产业工人"。
  3. 它最稀缺的从来不是"动作",而是"场景的多样性"——同一个"开门"动作,在病房、在车间、在酒店客房、在火锅店后厨,都是不同价值的训练样本。

但是——整个行业到现在都没有一份公开的、完整的、面向普通人的"场景全图"

公司各自有内部清单,平台各自有自己的 SKU 命名,论文用一套术语,招标文件用另一套术语,普通人想看懂"这个行业到底有多少种活儿可干",无从下手。

这本书就要补这个空白。

我们不发明新词,不引战术,不站队厂商,只做一件事:把全行业公开可见的 EGO 数采场景,按"领域→场景→情境→任务→动作"5 层装进一棵大树里,让任何人都能在 1 分钟内找到"我关心的那个场景在哪一页"。

你将获得什么

读完整本书,你会:

  1. 真正理解"EGO 数采"这件事,能在 5 分钟内向任何人讲清楚(哪怕对方完全没听过)。
  2. 完全掌握"领域-场景-情境-任务-动作"5 层架构这套通用语言——和任何采集公司、机器人公司、数据平台沟通时不再"鸡同鸭讲"。
  3. 看懂全行业 10 大领域、80+ 场景的全景图,知道自己的生活和工作经验适合做哪些场景的采集
  4. 拿到 1000+ 任务清单 + 5000+ 原子动作分解,可以直接对照下单、报价、立项、培训、考核
  5. 学会"场景画像 / 情境画像 / 任务画像"三件套写法,能为自己接的每一单数据写出符合行业惯例的元数据
  6. 知道每个场景对应的硬件设备怎么选、合规要求是什么、隐私分级如何评估、数据交付物长什么样。
  7. 知道如何把一个"我会做的事"扩展成一个"持续接单的小生意"——附录 E 提供了完整的"新场景提案模板"。
  8. 看懂未来 5 年新兴的、下一代的、目前还在实验室的"未来场景",提前卡位。

阅读路径建议

这本书一共 1 个卷首语 + 6 篇正文 + 6 个附录,全书约 30 万字。你不必从头读到尾,下面几条路径任选其一。

路径 A:完全外行(推荐)

按章节顺序从 00 卷首语 一路读到 22 拓展篇,每篇看完再翻附录。预计 1 个周末看完,建立完整认知。

路径 B:已经做采集,想找新场景

路径 C:开数据公司 / 开采集基地

路径 D:算法 / 产品经理找数据缺口

路径 E:投资人 / 研究员 / 媒体

完整目录

章节 你会得到
00 卷首语:为什么需要一本场景百科 一封给"采集员、企业、所有路人"的开场信,看完知道这本书能帮你解决什么
01 第一篇 导论:给完全陌生用户的 5 分钟入门 EGO 数采是什么、和拍 Vlog 的区别、为什么要分场景、5 层架构的"一图速览"
02 第二篇 架构:5 层场景体系到底是什么 领域/场景/情境/任务/动作的精确定义、ID 编码规则、5 个完整范例对照
03 第三篇 全图:10 大领域速览与选择决策树 一图看完所有领域、选择决策树(你适合哪个)、领域热度与单价对照表
10 领域一·家庭生活 厨房 / 客厅 / 卧室 / 卫浴 / 阳台 / 餐厅 / 玄关 / 书房 / 车库共 9 场景
11 领域二·餐饮服务 后厨 / 前厅 / 外卖 / 咖啡馆 / 茶饮 / 烧烤 / 火锅 / 中央厨房共 8 场景
12 领域三·工业生产装配 来料 / 上料 / 装配 / 拧紧 / 焊接 / 贴装 / 质检 / 包装 / 入库共 9 场景
13 领域四·物流仓储 入库 / 分拣 / 拣选 / 打包 / 出库 / 末端配送 / 退货 / 盘点共 8 场景
14 领域五·商业零售与陈列 上架 / 补货 / 理货 / 收银 / 试衣 / 退换 / 防损 / 盘点共 8 场景
15 领域六·酒店服务 前台 / 客房 / 餐饮 / 会务 / SPA / 泊车 / 行李 / 夜审共 8 场景
16 领域七·医疗护理与康养 接诊 / 给药 / 康复 / 护理 / 手术辅助 / 院感 / 居家照护共 7 场景
17 领域八·教育场景 幼教 / K12 / 职教实训 / 科学实验 / 特殊教育 / 家庭辅导共 6 场景
18 领域九·特种作业 高空 / 电力 / 化工 / 消防 / 应急 / 野外勘测 / 水下 / 夜班共 8 场景
19 领域十·专业科研与文创 实验室 / 野外科考 / 手工艺 / 3D 打印 / 影视 / 医美 / 兽医共 7 场景
20 第四篇 实战:从场景手册到项目立项 怎样从这本书的目录里找到一个具体场景、立项、报价、交付
21 第五篇 治理:命名编码与版本演进 5 层 ID 编码、版本号策略、场景废弃流程、与公司内部 SKU 系统的对接
22 第六篇 拓展:AGI 时代的新兴场景与下一代领域 太空 / 农业 / 公共安全 / 心理疗愈 / 元宇宙等 8 个未来场景
附录 A 全部领域-场景-情境总目录 1000+ 任务一页查的"地图册"
附录 B 3000 原子动作清单 手部 / 头部 / 移动 / 工具四大类完整清单
附录 C 场景-硬件适配速查表 每个场景对应"必备 / 推荐 / 可选"硬件
附录 D 合规与隐私分级表 5 级合规风险(L0–L4)、场景分级总表、关键法规与同意书要素
附录 E 新场景提案模板与社区贡献指南 提案模板、PR 流程、命名审查清单
附录 F 30 问场景 FAQ 30 个最常被问的问题集中解答

如何使用这本书

  1. 先看「30 秒导读」:每一篇 / 每一章开头都有 30 秒就能读完的导读,告诉你这章在解决什么问题、做完会得到什么。如果不感兴趣,可以直接跳过。
  2. 认领一个场景,跟着做一遍:所有领域章都按"场景画像 → 典型情境 → 任务清单 → 原子动作分解 → 采集要点 → 合规提示 → 数据交付物"7 段式展开,建议挑你最熟悉的一个场景,从头到尾走一遍。
  3. 对照「本章一图回顾」:章末的小结帮你把这章的"领域 → 场景 → 情境 → 任务 → 动作"串成一棵小树,方便日后翻查。
  4. 遇到术语先翻附录:80% 的常见疑问都收录在 附录 F 30 问场景 FAQ 里。

本书使用约定

5 层 ID 命名规范

全书用一套统一的 5 段式 ID 标注每一个原子动作,例如:

D01-S03-C02-T05-A12 = "领域 01(家庭)· 场景 03(厨房)· 情境 02(早餐准备)· 任务 05(煎鸡蛋)· 动作 12(翻面)"

层级 缩写 编号位数 例子 含义
领域 Domain D 2 位 D01 家庭生活
场景 Scene S 2 位 S03 厨房
情境 Context C 2 位 C02 早餐准备
任务 Task T 2 位 T05 煎鸡蛋
动作 Action A 2 位 A12 翻面

ID 系统对企业的好处:可以直接拿来做内部 SKU、订单号、数据集目录结构。

排版约定

  • 代码块:可以直接复制使用的命令、配置、提示词。
  • 「引号」:界面上的按钮、菜单或选项名称。
  • 粗体:值得你停下来重点理解的关键词。
  • 表格中的"难度"统一用 ★(1-5 星)表示,"单价"参考 2026 年 4 月公开市价中位数。
  • 场景合规风险分级以 L0–L4 为主表(详见 附录 D);部分领域章正文会用 P0–P3 表示画面隐私敏感度,与 L 级并行使用、含义不同。

本书风格的小约定

  • 我们假设你不是数据科学家,但愿意学一点点新东西。所有名词第一次出现都给"白话解释"。
  • 我们不会让你"先理解原理再动手",恰恰相反,我们让你先看到一个具体场景,再回头讲为什么。
  • 我们不会推荐"一定要用某家公司的设备"。每一个场景的硬件清单都给出通用规格 + 至少 2 家厂商做参考。
  • 我们也不会假装"这个行业完美无缺"。第十八章 特种作业附录 D 会老老实实告诉你哪些场景目前不该碰。

一句话总结

这本书要做的事情只有一件:把"机器人需要被人教会的所有事",按 5 层架构一次列清楚,让你知道自己能教它什么、教它有人买单

准备好了吗?翻开 00 卷首语 开始吧。


配套书籍:完整的 EGO 三部曲

本书是 EGO 三部曲中的"场景卷",与另外两本书互补:

写给谁 侧重
《第一人称数据采集(Ego)行业橙皮书:入门与入行指南》 想做采集员的个人 "我个人怎么入行、怎么挣到第一个 1 万元"
《Ego 数据采集企业橙皮书:企业入局实战指南》 企业主、投资人 "我公司怎么进场、怎么算账、怎么避坑"
《EGO 数采场景橙皮书:分层场景百科全书》(本书) 所有人 "全行业到底有哪些场景,按 5 层架构一次梳理清楚"

三本书可以单独阅读,但合起来组成完整的"EGO 数采全景图书馆"。

版本与变更

版本 日期 主要变更
v1.0.0 2026-04-19 初版发布:6 篇正文 + 10 个领域章 + 6 个附录,覆盖 80+ 场景、1000+ 任务、5000+ 动作

后续如有新增 / 勘误,会在本表追加,并在每章相关段落加 (v1.x 更新) 标注。我们会按季度发布新版本,跟随行业新场景同步增补。

版权与署名

  • 本书根据 CC BY-SA 4.0 协议开源,欢迎转载、翻译、改编。
  • 转载请注明原书《EGO 数采场景橙皮书:分层场景百科全书》及原始仓库地址。
  • 改编版本必须保持同一协议开源。
  • 商业用途(如纳入付费课程、纸质出版、收费社群)请先联系作者邮箱获取授权。

如果这本书帮到了你,最好的"赞赏"就是把它转发给一位还在迷茫"我能不能去做数采"的朋友——也许他下个月就因为你这个动作,找到了人生的下一份工作。