7.1 元宝能读哪些文件
支持的格式(截至 2026-04)
| 类别 | 支持格式 |
|---|---|
| 文档 | .pdf / .doc / .docx / .txt / .md |
| 表格 | .xls / .xlsx / .csv |
| 演示 | .ppt / .pptx |
| 图片 | .jpg / .jpeg / .png / .webp / .gif |
| 音频 | .mp3 / .wav / .m4a(自动转文字) |
| 视频 | .mp4 / .mov(提取关键帧 + 音频转文字) |
| 代码 | .py / .js / .ts / .java / .cpp / .go / .rs(任何主流语言) |
| 腾讯文档 | 直接调用,无需下载 |
单次能传多少
- 单个对话最多 50 个文件(这是当前上限,每个文件单独不能超过 100MB)
- 单次提问最多 5 个文件(同时分析)
- 图片 单张最大约 10MB
总字数限制
元宝的"上下文窗口"非常大——可以一次性读 几十万字 的内容。一份 100 页 PDF(约 10 万字)轻松吃下,不会丢失开头。
7.2 上传文件的 3 种方式
方式 1:直接拖拽(电脑端最快)
打开元宝网页/桌面端 → 把文件直接拖进对话框 → 自动上传。
方式 2:点击「+」按钮
对话框右下角的 「+」 → 选「文件」 → 选你要上传的文件。
方式 3:长按转发(微信好友形态最方便)
把元宝加为微信好友,然后任何文件 → 长按 → 转发 → 选「元宝」。
不要用"复制粘贴文件内容" —— 会丢格式、丢图片、丢表格。直接传文件最稳。
7.3 PDF 处理实战
PDF 是最常见的"长文档场景"。下面用 4 个真实案例展示。
案例 1:研究报告速读
场景:你手里有一份 80 页的《2026 中国 AI 大模型行业研究报告》,你想 5 分钟看完精华。
操作:
[拖拽 PDF 进对话框]
请帮我做这份报告的"5 分钟版本":
1. 报告核心结论(3 句话)
2. 报告里最值得记住的 5 个数据
3. 报告里最值得记住的 3 个案例
4. 报告里 3 个我"必须自己核对"的关键论断
5. 如果我要把这份报告讲给我老板听,最该说的 5 句话是什么?
请使用混元 T1 深度思考。
3 分钟内,元宝会给你一份高质量摘要。
案例 2:合同审阅找漏洞
场景:你公司要跟客户签一份 30 页的服务合同,你想知道"哪些条款对我们不利"。
操作:
[拖拽合同 PDF]
我是 SaaS 公司的销售总监,这份合同是我们要跟客户签的。请你以"风险管理专家"的视角审阅:
1. 找出 5 个对"我方(服务提供商)"潜在不利的条款,每个条款引用原文+解释为什么不利
2. 找出 3 个"模糊不清"的条款,需要我跟客户进一步澄清
3. 找出 2 个"我方应该补充"的条款(行业标准必备但合同没写)
4. 给我 3 个"谈判时可以让步、但要求对方让步什么"的策略
请使用 DeepSeek-R1 深度思考。
R1 会逐条扫描,找出比律师还细致的问题。
⚠️ 注:AI 审合同不能完全替代律师。重要合同最终一定要找专业律师过一遍。元宝的作用是"先过滤明显问题,再给律师做一道"。
案例 3:财报解读
场景:你想分析一家上市公司的年报。
操作:
[拖拽财报 PDF]
请帮我深度分析这份年报:
1. 营收结构(按业务/按地区拆解,给出占比)
2. 毛利率/净利率趋势(对比近 3 年)
3. 现金流情况(健康/警告?)
4. 资产负债结构(重要变化)
5. 管理层在"业绩说明"里强调了什么、回避了什么?
6. 你认为这家公司"值得长期持有"还是"短期博弈"?理由?
请基于财报内容回答,不要做"投资建议",只做"客观分析"。
请使用混元 T1 深度思考。
T1 会给出一份比券商研报还客观的分析(因为研报有立场,AI 没有)。
案例 4:教科书"翻译"
场景:你下载了一本英文专业教材,看不懂。
操作:
[拖拽教科书 PDF(可以是几百页)]
我想学这本教材,但我英语只有 6 级水平。请帮我:
1. 用中文写出这本书的核心目录(每章一句话讲清"在讲什么")
2. 找出整本书最重要的 10 个核心概念,每个用"7 岁小孩都能听懂"的中文例子讲清
3. 推荐我"该按什么顺序读这本书"(不一定从第一章开始)
4. 给我一份"30 天学完这本书"的学习计划
请使用混元 T1 深度思考。
T1 会真的把整本英文书读完,给你一份高质量的中文导读。
7.4 Excel 处理实战
很多人把元宝当"聊天 AI"用,忘了它能处理 Excel。
案例 1:数据分析
场景:你有一份"全公司员工工资表",想分析。
操作:
[上传 Excel]
请帮我分析这份工资表:
1. 各部门平均工资
2. 各部门工资最高/最低
3. 工资差距最大的部门是哪个?
4. 男女平均工资是否有差异?
5. 工龄和工资的相关性如何?
6. 是否存在"明显不合理"的工资数据?
元宝会自动跑数据分析,给出表格和结论。
案例 2:批量公式
场景:你不会写 Excel 公式,但你需要一个公式实现某个功能。
操作:
我有一份 Excel,A 列是日期(2026/1/1 到 2026/12/31),
B 列是销售额。
我希望在 C 列得到"截至当行的累计销售额",
D 列得到"该行所属季度",
E 列得到"该行的同比去年同期增长率"。
请帮我写出 C、D、E 三列的公式,并解释每个公式怎么用。
元宝会给出完整可粘贴的公式 + 使用说明。
案例 3:Excel → 报告
场景:你有一份销售数据 Excel,要写成季度报告。
操作:
[上传销售数据 Excel]
请基于这份数据,帮我写一份"2026 Q1 销售报告":
1. 总体业绩概览(数据 + 一句话总结)
2. 分区域分析(哪个区域好/差,原因猜测)
3. 分产品分析(哪个产品好/差)
4. 同比/环比对比
5. 异常数据预警
6. Q2 建议(基于数据趋势)
要求:
- 1500-2000 字
- 结论先行,数据支撑
- 用 Markdown 格式
元宝会输出一份直接可以交给老板的报告。
7.5 多文件对比
这是元宝的"杀手锏"——最多同时 5 个文件做对比分析。
案例 1:3 份合同对比
场景:你手里有 3 家供应商的报价合同,想找"性价比最高的"。
操作:
[同时上传 3 份 PDF:供应商A.pdf、供应商B.pdf、供应商C.pdf]
请帮我对比这 3 份合同,输出一份"对比表":
| 维度 | 供应商A | 供应商B | 供应商C | 我方有利 |
| --- | --- | --- | --- | --- |
| 价格 | | | | |
| 付款方式 | | | | |
| 交付周期 | | | | |
| 售后保修 | | | | |
| 违约条款 | | | | |
| 知识产权 | | | | |
最后给出:
- 综合推荐哪家
- 推荐理由(3 条)
- 谈判时可以"用 A 砍 B、用 B 砍 C"的杠杆点
元宝会严谨地对比每个维度,给出表格和推荐——省掉你 3 天的对比工作。
案例 2:3 年财报对比
场景:你想看一家公司 2024、2025、2026 三年的财报变化。
操作:
[上传 3 个年报 PDF]
请对比这 3 份年报:
1. 营收变化趋势(含增速)
2. 利润变化趋势
3. 业务结构变化(哪些业务在涨、哪些在缩)
4. 战略表述的微妙变化(管理层语气从"激进扩张"到"稳健"的迹象)
5. 我作为投资者,最该关注的"长期信号"
R1 或 T1 能从3 份合计 200 多页的文件里抽出关键变化——人工至少 3 天的工作量。
案例 3:5 篇行业研报横评
场景:你想知道"5 家券商对新能源汽车 2026 年的展望"分歧在哪里。
操作:
[上传 5 份研报 PDF]
请对比这 5 篇 2026 年的新能源汽车研报:
1. 5 家券商的"目标价"分别是多少?
2. 5 家的"看涨/看跌"立场?
3. 大家共识的 3 件事(高度一致的判断)
4. 大家分歧最大的 3 件事(判断截然相反的)
5. 哪一篇的"逻辑链最严密"?
6. 综合 5 篇,给我"个人投资者"3 条客观建议
这种"多源对比"是 AI 的核心价值——人不可能同时读 5 份 200 页的研报。
7.6 元宝 × 腾讯文档:双向打通
这是腾讯生态的独家优势。
联动 1:从腾讯文档"导入"到元宝
如果你的协作文档在腾讯文档里:
- 打开元宝
- 上传文件 → 选 「从腾讯文档导入」
- 授权访问 → 选你要分析的文档
- 元宝直接读,不用先下载
好处:永远拿到最新版本(不会出现"我下载的是 V1,同事改到了 V5"的尴尬)。
联动 2:把元宝对话"导出"到腾讯文档
元宝跟你聊出了一份方案/报告/合同——
- 对话右上角 → 「导出」
- 选 「导出到腾讯文档」
- 自动生成腾讯文档,支持多人协作
好处:直接跟同事/客户协作,不用复制粘贴。
联动 3:元宝帮你"批量改"腾讯文档
请打开我的腾讯文档"2026 销售报告",
帮我把所有"我们公司"改成"贵司",
所有"客户"改成"用户",
保留原格式。
元宝可以直接改你的腾讯文档(需要授权)。
联动 4:元宝帮你"读群里转发的"腾讯文档
群里同事 @ 你转发了一份腾讯文档链接——
- 复制链接
- 粘贴给元宝
- "请帮我读这份文档,告诉我重点"
元宝直接读,不用打开。
联动 5:跨文档"找信息"
请在我所有的腾讯文档里搜索"客户 X 的合同金额",
告诉我相关信息分布在哪些文档里,分别是多少。
这相当于给你的腾讯文档加了一个 AI 搜索。
7.7 长文档处理的 6 个高级技巧
技巧 1:分页提问(避免"中间被忽略")
虽然元宝能一次读完整本书,但有时候它会重点关注开头和结尾,中间略过。
解决:
请按以下方式精读这份 PDF:
1. 先读第 1-30 页,告诉我重点
2. 再读第 31-60 页,告诉我重点
3. 最后读第 61-100 页,告诉我重点
4. 给出整本书的综合摘要
技巧 2:精确定位提问
请告诉我,文件第 47 页第 3 段在说什么?请引用原文。
或:
请找出文件里所有提到"碳排放"的地方,列出页码并引用原文。
元宝能精确定位。
技巧 3:让元宝"画"思维导图
请基于这份 PDF,给我一份"思维导图大纲",
要求:
- 5 级以内
- 用 Markdown 格式(- 符号缩进表示层级)
- 我可以直接复制到 XMind
元宝输出的 Markdown 可以直接导入 XMind/Boardmix/MindMaster——一键生成思维导图。详见 第九章 AI PPT 与思维导图。
技巧 4:让元宝"找问题"
请像一个挑剔的批评者,找出这份报告(PDF)的 5 个最大漏洞:
- 论证不严密的地方
- 数据引用可疑的地方
- 逻辑跳跃的地方
- 结论过激的地方
- 隐藏假设的地方
这种"挑刺式提问"特别适合审阅别人的方案/报告/简历。
技巧 5:让元宝"翻译+总结+提炼"
请帮我处理这份英文研报(PDF):
1. 翻译成中文(不要"逐句翻译",要"意译")
2. 总结核心观点(5 句话)
3. 提炼最有价值的 3 个数据/案例
4. 这份研报对中国市场的启示
一气呵成,不用"分三次"。
技巧 6:让元宝"生成测验题"
基于这份教材 PDF,请帮我出 20 道选择题,分布如下:
- 简单 5 道(覆盖基本概念)
- 中等 10 道(需要理解才能答对)
- 困难 5 道(需要综合多章知识)
每题给出:
- 题干
- 4 个选项
- 正确答案
- 解析(为什么对/为什么错)
学生党、考研党、考证党的福音。
7.8 一个真实案例:宝妈用元宝"读完"育儿百科
我朋友是个宝妈,她有一本 600 页的《美国儿科学会育儿百科》,看了 3 年还没看完。
我教她:
Step 1:把整本书 PDF 上传给元宝。
Step 2:
我是一个 32 岁妈妈,孩子 2 岁。请帮我从这本百科里"按需提取":
1. 关于"2-3 岁孩子语言发展"的所有内容
2. 关于"如何处理孩子哭闹"的所有方法
3. 关于"幼儿日常营养搭配"的具体建议
4. 关于"什么时候必须看医生"的警示信号
请按上面 4 类,分别整理成"我可以打印贴冰箱上"的清单。
Step 3:元宝给她一份分类清晰、可打印的"育儿速查表"。
Step 4:以后随时问:
我宝宝今天发烧 38.5℃,按那本育儿百科,我应该怎么办?
这本她"看了 3 年没看完"的书,从此变成了"24 小时随叫随到的儿科助理"。
7.9 文件处理的 5 个常见翻车
翻车 1:图片文件 PDF 读不出文字
症状:你扫描的 PDF(图片格式)传给元宝,它说"这份 PDF 没有文字"。
解法:传给元宝时多说一句"这是扫描版,请用 OCR 识别"。元宝会主动调用 OCR 引擎。
翻车 2:超大文件传不上
症状:100MB 以上的文件传不上去。
解法:
- 用电脑端的 PDF 工具拆成多份
- 或者用 PDF 压缩工具压缩到 100MB 以内
- 或者只截取你需要的章节
翻车 3:Excel 里有合并单元格
症状:复杂 Excel(带合并单元格、多 sheet)元宝读得不准。
解法:先在 Excel 里"取消合并单元格",把数据整理成"一行一条"的标准表格再上传。
翻车 4:PPT 里有图片没文字
症状:你的 PPT 主要是图,元宝读出来空空的。
解法:
- 先导出成 PDF 再传
- 或者把 PPT 截图后,传截图给元宝(每张 PPT 一张图)
- 或者直接告诉元宝"PPT 主要是图,请描述图片内容"
翻车 5:上传后忘了"发送"提问
症状:你拖了文件进去,但没输入问题,元宝沉默。
解法:上传文件后必须输入"具体问题",元宝才会处理。单纯传文件不会触发分析。
7.10 跨文件 + 跨对话的"个人知识库"玩法
进阶玩法:把元宝当"个人知识库"。
Step 1:上传你的"知识资产"
把你常用的资料(白皮书、合同模板、PPT 模板、笔记、剪藏)都上传到一个长期保留的对话里。
Step 2:给这个对话起一个清晰的名字
比如"我的工作知识库 2026"。
Step 3:随时回去问
[在这个对话里]
请基于我之前传过的所有文件,告诉我:
1. 我在过去几个月做过哪些项目?
2. 我最常用的 PPT 模板是什么风格?
3. 我们公司客户合同的"标准付款条款"是什么?
元宝会基于这个对话里的所有上传内容回答你——相当于你有了一个"私人记忆库"。
注:跨对话长期记忆是 AI 行业的难题,元宝在这方面还在演进。但单个对话内的"长期上下文"已经能用。
7.11 本章一图回顾
「长文档与文件处理」
│
┌─────────────────┼─────────────────┐
▼ ▼ ▼
支持格式 上传方式 单次能力
PDF/Word/Excel 拖拽/「+」按钮 50 个文件
PPT/图片/音视频 长按转发 5 个并行分析
代码/腾讯文档 几十万字上下文
│ │ │
└─────────┬───────┴────────┬────────┘
▼ ▼
实战 4 大场景 腾讯文档双向打通
研报速读 导入/导出
合同审阅 协作/搜索
财报解读 批量改
教科书翻译
│ │
└────────┬───────┘
▼
高级 6 技巧
分页 / 定位 / 思维导图
找问题 / 翻译总结 / 出题
│
▼
"个人知识库"玩法
7.12 5 分钟动手实验
✅ 实验 1(1 分钟):传 PDF 做"5 分钟摘要"
- 找一份你电脑里"打开过没看完"的 PDF
- 上传 → 用 7.3 案例 1 的提问
✅ 实验 2(1 分钟):传 Excel 做数据分析
- 找一份 Excel 数据表(任何数据)
- 上传 → 让元宝告诉你"3 个有意思的发现"
✅ 实验 3(1 分钟):3 份文件对比
- 同时上传 3 个文件(任何 3 个)
- 让元宝做"3 文件对比表"
✅ 实验 4(1 分钟):腾讯文档导入
- 在元宝里点"上传文件" → 选"从腾讯文档导入"
- 授权 → 选一份你常用的腾讯文档
- 让元宝"总结这份文档"
✅ 实验 5(1 分钟):让元宝"出题"
- 上传一份你想"测验自己掌握了多少"的 PDF
- 用 7.7 技巧 6 的提问,让它出 5 道题考你
7.13 读完这章你应该知道
- ✅ 元宝支持 PDF/Word/Excel/PPT/图片/音视频/代码/腾讯文档
- ✅ 单次对话最多 50 个文件,单次提问最多 5 个文件并行
- ✅ 上传方式:拖拽 / 「+」按钮 / 长按转发(微信好友形态)
- ✅ 4 大实战场景:研报速读 / 合同审阅 / 财报解读 / 教科书翻译
- ✅ 多文件对比是元宝的杀手锏(3 份合同、3 年财报、5 篇研报横评)
- ✅ 跟腾讯文档双向打通——导入/导出/批量改/搜索
- ✅ 6 个高级技巧:分页 / 定位 / 思维导图 / 找问题 / 翻译总结 / 出题
- ✅ 进阶:把元宝当"个人知识库"用
下一章:第八章 写作与办公场景实战——周报、邮件、合同、商业计划书,元宝怎么帮你"日常办公省 50% 时间"。