ORANGE BOOK · EGO

附录 F · 30 问场景 FAQ


一、概念与价值(Q1–Q6)

Q1:EGO 数采到底是什么?

:EGO(Egocentric)数采指用第一人称视角(头戴相机、智能眼镜、腕带等)记录「我此刻在真实世界里做了什么」的数据采集方式。它和监控摄像头的最大区别是:镜头跟着人的身体动,能同时记录手、眼、物体与环境的相对关系——这正是训练具身智能、机器人操作模型最缺的信号。

Q2:EGO 和普通拍 Vlog 有什么本质不同?

:Vlog 追求故事与观感;EGO 追求可标注、可复现、可交付的动作与情境。具体差异包括:是否按任务切分、是否有元数据(场景 ID、任务 ID)、是否控制遮挡与光照、是否做隐私脱敏与合规存档。

Q3:为什么行业要强调「场景」而不只强调「动作」?

:同一个「开门」动作,在病房、酒店、冷库、家庭玄关,语义与风险完全不同。模型缺的不是「开门」这一个标签,而是「在某种约束下怎么开门」的分布。场景决定了:物体形态、空间布局、合规边界与失败模式。

Q4:这本书里的「五层架构」是哪五层?

领域(L1)→ 场景(L2)→ 情境(L3)→ 任务(L4)→ 动作(L5)。从粗到细:先定行业与空间,再定具体处境与目标,最后拆到原子动作。详见 02 架构篇

Q5:我是普通人,做 EGO 数采能挣钱吗?

:能,但不是躺赚。入门场景(零售上架、家庭家务、简单打包)时薪可能接近当地兼职水平;高技能、高合规、高风险场景(医疗辅助、特种作业、精密装配)单价显著更高。关键变量是:场景稀缺度 × 技能证书 × 设备与稳定性 × 合规成本。另:本书中的单价不是承诺,仅为 2026 年公开市价的区间参考,用于立项与谈判锚点;真实成交价受城市、甲方、急单、复购、数据质量 SLA 影响极大,请以合同为准。

Q6:EGO 数据最后给谁用?

:典型去向包括:机器人 / 具身智能公司、自动驾驶与物流算法团队、科研机构的视觉—语言—动作(VLA)研究、以及部分平台型数据公司的多模态训练集。谁采购、谁署名、谁二次分发,都应在合同与同意书中写清。


二、五层架构与命名(Q7–Q10)

Q7:D01-S03-C02-T05-A12 这种 ID 怎么读?

:从左到右逐级变细:领域 01 → 场景 03 → 情境 02 → 任务 05 → 动作 12。企业可直接把该 ID 当作 SKU / 订单行 / 数据集目录名。详见 02 架构篇21 治理篇

Q8:附录 B 里的 A01001 和五层里的 A12 会冲突吗?

不会刻意混用。五层式末尾的 A场景内局部编号;附录 B 的 Axxxxx全局动作字典 ID。立项时建议同时记录二者:「局部 ID + 全局字典 ID」,便于对内管理与对外复用。

Q9:情境(Context)和任务(Task)到底怎么切?

情境偏「环境与目的约束」(如夜班巡检、早高峰出餐);任务偏「可独立完成的工作单元」(如更换灯泡、封装一箱货)。若你发现「一个情境里永远只出现同一个任务」,可能切分过细或过粗——回到 02 架构篇 的范例校准。

Q10:公司已有自己的 SKU,还要用本书 ID 吗?

:不必二选一。推荐做法:内部 SKU ↔ 本书 ID 做映射表(一对多或多对一都可),这样既保留历史订单,又能与行业、论文、招标对齐。模板见 21 治理篇


三、接单、报价与合同(Q11–Q14)

Q11:第一次接单,怎样报价才不算亏?

:把成本拆成:人力时长 + 设备折旧 + 差旅与场地 + 合规与脱敏 + 返工预留(建议 ≥15%)+ 税与平台抽成。书中 20 实战篇 提供了从场景手册到 SOW 的步骤;不要只按「小时」报,要按「可交付成果」报。

Q12:甲方只要「多拍一点」,该不该加钱?

:该。范围蔓延是数采项目亏损的第一原因。任何新增场景、新增任务、新增受试者、新增合规流程,都应触发 变更单(Change Order) 或重新签 SOW。

Q13:合同里必须写清的「四条底线」是什么?

数据用途与禁止用途、保存期限与删除机制、知识产权与署名、违约责任与验收标准。医疗、未成年人、特种作业等还需单独条款;详见 20 实战篇附录 D

Q14:甲方要求「独家排他」,要注意什么?

:排他通常意味着你不能再把同类数据卖给其他家,单价应显著高于非排他。务必明确:排他的地理范围、时间范围、场景范围、数据模态;否则容易被一张合同锁死全部生意。


四、设备、画质与采集规范(Q15–Q18)

Q15:是不是必须用智能眼镜?

:不一定。场景决定设备:家庭、零售、拣选等大量场景入门档即可;焊接、水下、冷链、强电磁环境往往需要工业档或定制方案。速查 附录 C

Q16:为什么项目要求 60fps?我 30fps 不行吗?

快动作(颠勺、分拣抛投、部分球类与工业节拍)在 30fps 下会混叠、难以标注。若甲方 SLA 写明 60fps,应用设备与存储方案满足;若未写明,应在合同中确认帧率与可接受的模糊边界。

Q17:头戴设备太重,长时间采集怎么扛?

:优先换更轻或分体式方案;其次控制单次连续采集时长、增加休息与备份电池;再其次优化头戴方式(配重、额垫)。附录 C 有重量与佩戴时长经验表。

Q18:夜景/暗光下画质很差,数据还有价值吗?

:可能有,但要提前与甲方对齐:是否允许补光、是否只做「低照度专项」、是否接受更高噪声。否则容易验收扯皮。


五、隐私、合规与「千万别碰」(Q19–Q23)

Q19:拍家里视频,算不算侵犯家人隐私?

:算风险点。任何可识别个人(脸、声音、证件、屏幕内容)都需本人知情同意;家庭场景建议签署书面同意、划定可拍区域、对敏感区域关机。详见 附录 D

Q20:商场、餐厅里拍到路人怎么办?

:原则是最小化采集、默认脱敏(人脸模糊、声纹处理)、必要时避开人脸主朝向或选择非高峰时段。商业零售与餐饮部分场景风险更高,见 14 领域五11 领域二

Q21:未成年人场景到底能不能做?

默认极高风险。除严格合规与监护人同意外,多数平台与本书建议慎接或不接。详见 17 领域八附录 D

Q22:医院场景为什么总说要 IRB / 伦理审查?

:因为涉及弱势受试者、敏感健康信息、研究用途交叉。是否属于「研究」不由你口头定义,而由合规路径定义。医疗章节见 16 领域七

Q23:哪些场景建议直接拒绝?

:本书明确提示的私密空间(浴室、试衣间内部等)、未授权的高危区域、涉密区域、明显违法活动——不接。具体分级见 附录 D 与各章合规段。


六、行业与职业路径(Q24–Q27)

Q24:我想入行,从哪个领域开始最稳?

:对多数人:家庭、零售、物流打包门槛相对较低;有技能证书者可看 工业、医疗、特种。用 03 全图篇 的决策树自测。

Q25:「采集员」和「标注员」会不会是同一份工作?

:不一定。采集产生原始多模态数据;标注把数据变成标签。小公司一人全包很常见;大公司往往分工。你要涨价,通常靠稀缺场景 + 稳定质量 + 合规不出事,而不是靠「标得快」。

Q26:女孩子/体力弱是不是不适合工业和物流?

:不能一概而论。工业与物流内部岗位差异极大:有的重体力,有的重精细与流程。建议看具体 任务画像 而不是领域标签。书中每个场景有任务与难度参考。

Q27:自由职业 vs 挂靠公司,怎么选?

:自由职业灵活但合规与结算风险自负;挂靠公司可分担合同与税务,但抽成更高。高风险场景(医疗、特种、涉外)通常更需要公司主体与保险。


七、数据交付与协作(Q28–Q30)

Q28:交付时除了视频还要交什么?

:常见「交付包」包括:原始媒体 + 时间轴元数据 + 场景/任务 ID + 设备与时间同步信息 + 已知问题说明(遮挡、缺帧)。甲方若只要视频,也要在合同里写明——否则后续标注成本会反弹到你身上。

Q29:甲方要做「数据出境」,我要配合吗?

:仅在合法合规路径内配合。数据出境涉及安全评估、合同备案、目的限制等,个人与小团队往往不具备判断能力——应要求甲方提供法务意见与必要文件,并在合同中划分责任。通用法律名词可参考 附录 D 中国际法规表。

Q30:我发现一个书里没写的新场景,怎么办?

:欢迎按 附录 E 提交结构化提案:真实需求依据、与近邻场景差异、任务与动作清单、硬件与合规评估齐全者,更容易进入下一版「场景库」。


行动清单

  • 把本文 Q13(合同四条底线) 复制到你的项目检查清单里。
  • 打开 附录 A,圈出你未来 30 天想试的 3 个任务 ID。
  • 若你已有头戴设备,用 附录 C 给设备对号入座,记下下一单要升级的参数(帧率 / IP / 续航)。

自检三问

  1. 五层架构从粗到细的顺序,你能不假思索背出来吗?
  2. 「情境」和「任务」各举一个例子说明差别。
  3. 你所在城市,接一单零售上架病房护理辅助,你认为合规成本差在哪里?

附:快速索引

主题 去哪读
五层定义与 ID 02 架构篇
领域选择与决策树 03 全图篇
立项与合同 20 实战篇
版本与治理 21 治理篇
任务总表 附录 A
原子动作 附录 B
硬件 附录 C
合规分级 附录 D
新场景提案 附录 E