ORANGE BOOK · PERPLEXITY

第十一章 Comet 浏览器:从浏览到行动


一、Comet 是什么(90 秒搞懂)

如果用一句话描述 Comet,那就是:

Comet = Chrome 的内核 + Perplexity AI 的灵魂 + 一个会"动手"的助手

不是一个新浏览器引擎——它基于 Chromium(和 Chrome / Edge / Brave 同根),所以你所有 Chrome 插件都能装,所有网站都正常打开。

特别的地方是:

  1. 永久驻场的 Assistant 侧边栏:随时按 Cmd / Ctrl + L 唤起 AI,AI 看得见当前网页
  2. AI 能"操作"你的浏览器:"帮我把这个网页转发到我邮箱"、"帮我把这 5 个航班加进日历"——AI 真的会去点
  3. 多 Tab 协同:AI 能同时读多个 Tab 的内容做综合
  4. 跨网站记忆:AI 知道你 10 分钟前在另一个 Tab 看了什么
  5. 本地隐私优先:很多操作在本地完成,不必把数据传给服务器

1.1 Comet 适合谁

角色 Comet 的核心价值
知识工作者 一边看网页一边问 AI,零切换成本
研究员 多 Tab 同时分析,AI 帮你"横向对比"
内容创作者 看素材时直接让 AI 整理 / 改写
销售 / 商务 AI 帮你写跟进邮件、查 LinkedIn、整理 CRM
投资人 同时看 5 家公司的财报,AI 给你横向对比
程序员 看 GitHub / Stack Overflow 时直接问 AI 解释
普通人 订机票、查快递、续保险,一句话说完

1.2 现在能拿到 Comet 吗?

截至 2026 年 4 月

平台 状态
macOS ✅ 公开下载(Pro / Max 用户优先开 Assistant 高级功能)
Windows ✅ 公开下载
iOS ✅ App Store("Comet by Perplexity")
Android ✅ Play Store
Linux 🟡 仍是 Beta(Snap / Flatpak)

国内访问:直接到 comet.perplexity.ai 下载,一切顺畅就科学上网,不顺畅就备好镜像源。

二、安装与首次启动(5 分钟)

2.1 下载

  • macOS / Windows / Linux:comet.perplexity.ai 一键下载
  • iOS / Android:搜索 "Comet by Perplexity"

2.2 首次启动 5 步走

  1. 登录 Perplexity 账号:用 Google / Apple / 邮箱
  2. 导入数据:可以一键从 Chrome / Safari / Edge / Firefox 导入(书签、密码、历史、Cookies、扩展)
  3. 设默认浏览器:建议设——这样所有链接都用 Comet 打开
  4. 选默认搜索引擎:默认就是 Perplexity,也可改回 Google
  5. 唤起 Assistant:按 Cmd + L(Mac)或 Ctrl + L(Win)打开右侧边栏

小贴士:第一次启动建议把"导入 Chrome 数据"勾上——你 10 年的书签、密码、登录态会一秒搬进 Comet。

2.3 必须打开的 5 个设置

进入 设置

  1. 快捷键:把 Cmd + L 改成你最顺手的(默认就够用)
  2. AI 模型:选你最常用的(默认 Sonar Pro 已经够好)
  3. 隐私:开"本地处理优先"
  4. 历史记忆:开"AI 可以读历史"——这是 Comet 的灵魂
  5. 多 Tab 联动:开"AI 可以同时读多个 Tab"

三、Comet 的核心快捷键(背 5 个就够)

快捷键 (Mac) 快捷键 (Win) 功能
Cmd + L Ctrl + L 唤起 / 关闭 Assistant 侧边栏
Cmd + K Ctrl + K 在地址栏直接问 AI(不打开侧边栏)
Cmd + Shift + A Ctrl + Shift + A 让 AI"行动":帮我做一件事
Cmd + T Ctrl + T 新 Tab
Cmd + Shift + T Ctrl + Shift + T 恢复刚关闭的 Tab

唯一需要肌肉记忆的就是 Cmd + L——只要养成这个习惯,你的浏览效率就翻倍。

四、20 个 Comet 真实用法(直接复制)

类别一:阅读 / 总结

用法 1:把当前网页变成 200 字摘要

(按 Cmd+L)
帮我把这个页面总结成 200 字以内,重点标出 3 个关键数字。

用法 2:把长文章变成"听书"风格音频脚本

帮我把这篇文章改写成"得到"听书风格的 5 分钟脚本,
要有:开场钩子 + 3 个核心观点 + 一个故事 + 一句金句结尾。

用法 3:从 PDF / Word / Excel 直接问

(在浏览器里直接打开 PDF / Word,按 Cmd+L)
请帮我分析这份 [PDF / Excel]:
1. 5 个核心结论
2. 3 个有疑问的地方
3. 我下一步该做什么

用法 4:YouTube 视频"3 分钟读完"

(在 YouTube 视频页按 Cmd+L)
帮我把这个视频转成"3 分钟读完版":
1. 视频核心观点(5 个)
2. 关键时间戳(带分秒)
3. 一句话推荐 / 不推荐

类别二:横向对比

用法 5:5 个 Tab 横向对比

(同时打开 5 个 Tab:京东 / 淘宝 / 拼多多 / 苏宁 / 国美 同款商品)
请帮我对比这 5 个 Tab 里的商品:
- 价格
- 配送时间
- 售后政策
- 真实评价
- 推荐谁

用法 6:竞品官网横向对比

(同时打开 5 家 SaaS 竞品官网)
请帮我做一份 5 家 SaaS 竞品对比表:
- 价格 / 功能 / 客户 / 差异化
输出 markdown 表格。

类别三:表单 / 邮件 / 自动化

用法 7:自动填长表单

(打开一份冗长的注册 / 申请表)
帮我自动填这个表,我的资料:
姓名:张三
公司:XX
其他参考我上次填的(在我历史记录里)

用法 8:自动写邮件并发送

(在 Gmail 中按 Cmd+L)
请帮我给 [收件人] 写一封 200 字的回复:
- 我的核心意思:[一句话]
- 风格:[正式 / 友好 / 强硬]
写好后帮我直接放到 Gmail 的草稿里

用法 9:批量回复 LinkedIn / 邮件

(在 LinkedIn 收件箱)
请帮我看一下未读消息:
1. 哪些是"重要的"(需要 24 小时回复)
2. 哪些是"招聘 spam"(直接归档)
3. 给重要的写好回复草稿

类别四:购物 / 出行

用法 10:订机票

(在携程 / Skyscanner / Google Flights)
帮我订 5 月 12 号上海到京都最便宜的直飞,
2 个成人 + 2 个老人,
要 17 公斤行李,
预算每人 4000 以内。
找好后填好乘机人信息,停在"确认支付"前一步给我。

用法 11:续车险

(在保险公司官网)
帮我续车险,
和去年一样的方案,
对比一下"添加涉水险"的价格。
找好后停在"确认支付"前一步给我。

用法 12:抢演唱会票

(在大麦 / 猫眼)
[歌手] [日期] 演唱会,
帮我盯 [城市] 的票,
出现 [价位] 就帮我下单,
抢到后停在支付前。

类别五:研究 / 工作

用法 13:抓取数据到表格

(在带表格的网页)
帮我把这个表格抓出来:
1. 导出 CSV
2. 加一列"我的备注"
3. 上传到我的 Google Sheets

用法 14:连续读 10 篇文章

(标记 10 个 Tab 作为研究材料)
请帮我读完这 10 个 Tab,
然后给我一份 1500 字综述,
包含:5 个共识、3 个分歧、未来趋势。

用法 15:把多页文章合并成一个 Notion 页面

(同时打开 5 篇文章)
请帮我把这 5 篇文章整理成一个 Notion 页面:
- 主题:[X]
- 结构:背景 / 核心观点 / 案例 / 我的思考
- 引用每段的来源链接
然后帮我推送到 Notion 我的 [数据库名]

类别六:日常生活

用法 16:查快递

帮我查我所有快递,
告诉我:
- 几个在路上
- 几个今天能到
- 哪些需要我去自提点取

用法 17:医院挂号

(在挂号 App / 网站)
帮我挂 [医院] [科室] [日期] 的号,
医生优先 [姓名],
账号密码在我密码管理器里
挂到后告诉我,
没挂到就明天再帮我盯

用法 18:补开发票

(在 12306 / 携程)
帮我把过去 3 个月的所有差旅票补开发票,
统一抬头:[公司]
税号:[XX]
开好后下载 PDF 保存到桌面 [发票文件夹]

类别七:跨网站联动

用法 19:把这条新闻发到 5 个地方

(在某新闻页面)
请帮我:
1. 总结成 100 字
2. 同时发到:
   - 我的 Twitter(带 #[标签])
   - 微信"工作群"(用更正式语言)
   - 飞书"早报频道"(带"早报"前缀)
   - Notion 我的"新闻库"

用法 20:自动化"早报"

(每天早 8 点定时)
请帮我做一份"晨间早报":
1. 我订阅的 RSS(在书签 [RSS 文件夹])昨天的更新 TOP 5
2. 我关注的 5 家公司今天的新闻
3. 我的待办(拉取 Notion 我的 Tasks 数据库)
4. 今天的天气、空气质量、日历
推送到我的邮箱 [X]

五、Comet 的"行动模式"(Agent Mode)详解

Cmd + Shift + A 触发的是 Comet 最强的功能——Agent Mode(行动模式)。

5.1 行动模式 vs 对话模式

维度 对话模式(Cmd+L) 行动模式(Cmd+Shift+A)
AI 角色 答疑 / 总结 替你执行
是否点击网页 不点 会点
是否填表 不填 会填
是否切换 Tab 不切 会切
是否调用其他网站 不调 会调
速度 秒级 30 秒 - 5 分钟
适用 阅读 / 思考 完成具体事情

5.2 行动模式怎么"管教"它

3 个原则

  1. 明确边界:告诉它"做到 X 步停下"——避免它自作主张完成支付
  2. 要求确认:关键操作前必须给你看截图 / 总结再执行
  3. 加保护:永远别让它替你"花钱 / 发邮件 / 改资料"——停在最后一步

模板

请帮我 [动作描述]。

约束:
1. 做完每一步给我看一次"我现在要做的事"
2. 涉及 [钱 / 邮件 / 资料修改] 时,**停下来等我确认**,不要自动确认
3. 如果遇到我没填过的信息,**问我**,不要瞎填
4. 完成后给我一份"我做了什么"的清单

5.3 行动模式 5 个最常用场景

场景 1:续保 / 续费

帮我续 [服务] 一年,
用我去年的方案,
确认价格 [X] 元后停在支付前。

场景 2:订餐厅

帮我在 [App] 订今晚 7 点 [餐厅],
2 个人,
要靠窗位置,
订上后帮我加到日历,
并给 [朋友] 发个微信"今晚 7 点见"

场景 3:抢号

帮我盯 [医院] [科室] [医生] 下周一开放的挂号,
9 点准时刷新,
有号立刻抢,
抢到后微信通知我

场景 4:批量操作

帮我把这 50 个 LinkedIn 联系人按"是否回复过我"分类,
做成 Google Sheets,
没回复的用"温和提醒"模板再发一封,
**先给我看 5 个样例,我确认再批量发**

场景 5:周期任务

每周一早 9 点,请帮我:
1. 抓取 [数据源 URL] 上周的数据
2. 整理成图表
3. 发到我邮箱
4. 同时存入我 Notion [数据库]

六、Comet vs Chrome / Edge / Arc:为什么应该换

6.1 横向对比

维度 Chrome Edge Arc Comet
内核 Chromium Chromium Chromium Chromium
AI 助手 Gemini 侧栏(弱) Copilot(中) Max(中) Perplexity(强)
AI 能"动手" 部分
多 Tab AI 联动 部分
引用透明 每答必带引用
跨页面记忆 部分
隐私 一般 一般 好(本地优先)
插件兼容 ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐⭐⭐(Chrome 插件直接装)

6.2 5 类人最该立刻换

  1. 每天看 50+ 网页的"信息超载者" → AI 帮你"压缩"信息
  2. 要"调研 + 写"的内容创作者 → 边看边问省一半时间
  3. 要"对比 + 决策"的购物族 / 投资族 → 多 Tab 横向对比
  4. 想"自动化"重复操作的效率控 → Agent Mode 解放双手
  5. 不想再"切换 ChatGPT 页面"的人 → 浏览器原生 AI

6.3 5 类人可以慢点换

  1. 网络游戏 / 直播工作者(性能优先)
  2. 极度小众网站 / 老网站重度用户(兼容性可能略低)
  3. 公司强制必须用 IE / Safari 的合规岗位
  4. 老人(学习成本)
  5. 完全不在乎 AI 的"老派浏览者"

七、Comet 隐私与安全:5 件你必须知道

  1. AI 默认能看到当前 Tab 的内容——隐私页面(银行 / 医疗)建议关侧边栏
  2. 历史记忆默认开启——觉得不放心可以关,但会牺牲很多智能能力
  3. 行动模式有"二次确认"层——但你也要养成"看清再点"的习惯
  4. 本地处理 vs 云端处理:默认部分本地,详细参看设置 → 隐私
  5. 隐身模式:"Private Window" 时 AI 不读历史、不存对话

底线建议:所有"涉及钱 / 敏感个人资料"的关键操作,永远手动确认,不要让 Agent Mode 自动完成。

八、Comet 高阶:自定义 Workflow

8.1 写一个"每周复盘"Workflow

设置 → Workflows → New

名字:每周复盘
触发:每周日晚 8 点
动作:
1. 抓取我浏览器过去 7 天 TOP 20 访问网址
2. 让 AI 总结"我这周关注了什么"
3. 抓 Notion 我的"待办" 完成情况
4. 综合成"周复盘",发到我邮箱
5. 同时存入 Spaces / 我的"复盘记忆库"

8.2 写一个"客户跟进"Workflow

名字:客户日报
触发:每个工作日早 9 点
动作:
1. 扫描 LinkedIn 我关注的 50 个客户的动态
2. 找出"今天发了重要内容"的人(融资 / 升职 / 公司新闻)
3. 给我一份"今天该联系谁 + 联系话术"
4. 一键允许我"回复 / 评论"

8.3 写一个"早报"Workflow

名字:晨间早报
触发:每天早 7 点
动作:
1. 抓取 5 个新闻网站头条
2. 抓取我订阅的 RSS(来自书签某文件夹)
3. 抓取我关注公司的最新发布
4. 按"政经 / 行业 / 个人关注"分类
5. 用我的早报模板组装
6. 发送到邮箱 + 推到飞书 / 微信

九、Comet 5 个常见问题

Q1:Comet 会替代 Chrome 吗?

:对个人用户,90% 场景可以替代——Chrome 插件全兼容,性能也接近。剩下 10% 是公司强制 / 极小众网站。

Q2:Comet 占内存吗?

:和 Chrome 差不多——侧边栏 AI 待机时几乎不占资源,只在你触发时调用。

Q3:Comet 是免费的吗?

:浏览器完全免费下载。但里面的 Assistant:

  • Free 用户可以用基础功能(每天有限次数)
  • Pro 用户解锁"Agent Mode"和高级模型
  • 推荐 Pro 用户深度使用

Q4:Comet 能在国内用吗?

:浏览器本身能下能用,但内置 AI 调用 Perplexity 服务——所以需要稳定的科学上网。和你用 Perplexity 网页版的网络条件一样。

Q5:Comet 安全吗?我的密码会泄漏吗?

:Perplexity 官方公告:

  • 密码 / 表单数据只在本地加密存储
  • AI 看不到你的密码(即使你打开了密码管理器页面)
  • Agent Mode 涉及账户操作时必须二次确认
  • 但任何 Agent Mode 都建议你先在沙盒账号试,再用主账号

十、本章小结

┌─────────────────────────────────────────────────┐
│           Comet 浏览器 一图回顾                   │
├─────────────────────────────────────────────────┤
│  本质:Chromium + Perplexity AI + Agent          │
│                                                  │
│  3 个核心能力:                                  │
│  ① 看懂你正在看的网页(Cmd+L)                  │
│  ② 替你操作浏览器(Cmd+Shift+A)                │
│  ③ 多 Tab 联动 + 跨页面记忆                     │
│                                                  │
│  最该用的 5 件事:                               │
│  • 长文摘要        • 多 Tab 对比                │
│  • 表单填写        • 邮件回复                   │
│  • 周期任务自动化                                │
│                                                  │
│  最该警惕的:                                    │
│  Agent Mode 涉及"钱 / 敏感"时永远人工确认         │
└─────────────────────────────────────────────────┘

下一章我们看 Perplexity 还有哪些"宝藏功能"——Labs(生成 PPT/网页)、Discover(个性化早报)、Personal CFO(财务管家)

翻到 第十二章 Labs、Discover 与 Personal CFO 继续。


本章任务清单

  • 下载安装 Comet,从 Chrome 一键导入数据
  • 把默认浏览器改成 Comet,用 1 周
  • Cmd+L 总结 3 篇你今天看的长文
  • Cmd+Shift+A 完成 1 件"自动化"操作(订餐 / 续费)
  • 翻到 第十二章 继续