知识管理 Notion网页抓取 · MCP 橙皮书

一、为什么知识管理是 MCP 最被低估的场景

很多人把知识管理理解成"做笔记"，其实它真正的痛点是：

信息源太多：网页、推送、播客、邮件、群聊、PDF、视频；
搬运成本高：复制粘贴 + 整理格式 + 加 tag + 链接其他笔记；
沉淀缺位：今天看了一篇好文，三个月后想用却找不到；
检索失效：笔记越多越乱，最后"找笔记"比"看新内容"还累。

MCP 完美解决前三件—— 它让"信息源 → 知识库"这条路自动化、可重复、可扩展。

二、整体地图

flowchart LR
    classDef src fill:transparent,stroke-width:2px;
    classDef ai fill:transparent,stroke-width:2px;
    classDef kb fill:transparent,stroke-width:2px;

    subgraph Source [输入源]
      Web[网页 Fetch]:::src
      Search[搜索 Brave Search]:::src
      Mail[邮件 Gmail]:::src
      PDF[PDF 文件]:::src
      RSS[RSS Feed]:::src
    end

    subgraph AI [AI 处理]
      Sum[摘要 / 提炼]:::ai
      Tag[打标签 / 分类]:::ai
      Link[关联到既有笔记]:::ai
    end

    subgraph KB [知识库]
      Notion[Notion MCP]:::kb
      Obs[Obsidian MCP]:::kb
      Fs[Filesystem]:::kb
    end

    Web --> Sum --> Notion
    Search --> Sum --> Obs
    Mail --> Tag --> Notion
    PDF --> Sum --> Fs
    RSS --> Link --> Obs

不一定全装，但至少配 1 个知识库 + 1 个抓取源，立刻能用。

三、Notion MCP

1. 装

官方 MCP（远程，OAuth）：

"notion": {
  "url": "https://mcp.notion.com",
  "auth": { "type": "oauth2" }
}

或本地 stdio + 自己的 integration token：

"notion": {
  "command": "npx",
  "args": ["-y", "@notionhq/notion-mcp-server"],
  "env": {
    "NOTION_TOKEN": "secret_xxx"
  }
}

第一次连，要把你想让 AI 操作的页面/数据库手动 Share 给 integration，否则 AI 看不到（这是 Notion 自己的安全机制）。

2. 能做什么

读 / 写页面；
操作数据库（查、加行、改字段）；
创建子页面；
修改属性 / 标签 / 状态。

3. 神级提示词

把搜索结果变成笔记

在网上搜 5 篇关于「软件工程师 30 岁后职业规划」的最有深度的文章，每篇用 Fetch 抓全文，提炼 3 个观点 + 1 句最受启发的原文引用，在我的 Notion『阅读笔记』数据库里建 5 条新页面，标题用文章标题、tag 设为『职业发展』，作者字段填好。

周报素材沉淀

把我本周提交的所有 PR、写的所有文档、参加的所有会议，统一汇总到 Notion『周报素材』页面，分『进展 / 反思 / 下周计划』三栏。

客户档案管理

这是今天和客户 X 通话的录音转写文本。提炼出 5 个关键信息（需求 / 担忧 / 决策时间线 / 预算 / 关键人），更新到 Notion 客户档案数据库 X 这一行；历史对话追加到"沟通记录"长文本字段，按时间倒序。

四、Obsidian MCP

1. 装

社区版有几个，体验最好的：

"obsidian": {
  "command": "npx",
  "args": ["-y", "mcp-obsidian"],
  "env": {
    "OBSIDIAN_VAULT_PATH": "/Users/you/Documents/MyVault",
    "OBSIDIAN_API_KEY": "..."
  }
}

需要在 Obsidian 里装 "Local REST API" 插件，开 API。

2. 能做什么

读 / 写笔记（markdown）；
创建双链 [[笔记名]]；
看 / 改 frontmatter；
搜索笔记内容。

3. 神级提示词

自动建立双链

我刚写完一篇笔记 [[2026-04-19 MCP 学习总结]]，看一下我 Vault 里相关的笔记，自动在文末加一个『相关笔记』section，列出 5 条最相关的双链。

笔记复盘

拉出过去 30 天我在 Obsidian 里写的所有日记，分析重复出现的关键词、情绪走势、未完成的事项，写一份『四月月度复盘』笔记。

五、Fetch + Brave Search + Memory：DIY 一个"AI 研究员"

配置

{
  "mcpServers": {
    "fetch": { "command": "uvx", "args": ["mcp-server-fetch"] },
    "brave-search": {
      "command": "npx",
      "args": ["-y", "@modelcontextprotocol/server-brave-search"],
      "env": { "BRAVE_API_KEY": "..." }
    },
    "memory": {
      "command": "npx",
      "args": ["-y", "@modelcontextprotocol/server-memory"]
    },
    "filesystem": {
      "command": "npx",
      "args": ["-y", "@modelcontextprotocol/server-filesystem", "/Users/you/research"]
    }
  }
}

用法：让 AI 当你的"调研专家"

我要写一篇关于"AI Agent 的商业模式演进"的深度文章。请你做研究员：

用 brave-search 搜出 10 篇 2025-2026 年高质量长文；

用 fetch 把每篇全文抓下来；

提炼每篇的 3 个核心观点 + 1 段最有价值的原文；

把所有原文 markdown 存到 ~/research/agent-business-model/；

综合观点写成一份「研究备忘录」放到同目录；

把这篇研究的关键洞见和我个人的写作角度记到 memory 里。

整个过程 10 分钟。 这就是 2026 年"个人研究员"的常态。

六、自动剪藏 + 自动总结的工作流

每个人都遇到过：

朋友圈分享的好文章，存了从来没看；
浏览器收藏夹两万条，从来不打开；
微信收藏里几千条，找不着。

下面这套工作流可以解决：

配置

fetch + filesystem + notion（或 obsidian）+ time。

工作流提示词

这是我今天看到的一批 URL：
https://...
https://...
https://...
对每一条：

用 fetch 抓全文；

用 200 字写摘要 + 3 个 bullet points + 1 句金句；

自动判断分类（科技 / 商业 / 生活 / 哲学），打 tag；

在 Notion『阅读收藏』数据库建一行，URL、摘要、要点、tag、日期都填好；

列出今天哪几篇值得"晚上读全文"。

每天 5 分钟，把"剪藏 → 沉淀 → 复用"全自动化。

七、PDF / 论文 MCP

研究人员、学生、投资人会用到：

PDF MCP：让 AI 读 PDF 全文（不是只看前几页），可摘要、提取图表数据；
arXiv MCP：搜论文、看摘要、按引用数排序；
Zotero MCP（社区版）：让 AI 维护你的文献库。

配置示例（PDF MCP）：

"pdf": {
  "command": "uvx",
  "args": ["mcp-server-pdf"]
}

提示词：

把 ~/research/papers 文件夹里所有 PDF 各做一份 1 页摘要，标题、作者、研究方法、核心结论、对我的工作启示，写成一份合订本 markdown。

八、知识库设计的几条小建议

MCP 让"自动化"变得容易，但知识库结构本身仍然要你设计好。否则会出现"AI 装了一肚子垃圾"的局面。

1. 三类页面 + 一类数据库

Inbox（收件箱）：所有新内容先扔这里；
Permanent Notes（永久笔记）：经过你二次加工的、可以长期复用的；
Maps of Content（索引页）：按主题串起来的"目录"；
数据库：阅读收藏、人物 / 客户档案、项目进度、待办。

2. AI 默认写到 Inbox，再由你"挑"

不要让 AI 直接往 Permanent Notes 塞东西，让它写到 Inbox，你每周 review 一次，决定哪些升级为永久笔记。

3. tag 不要太多

3-7 个一级 tag 就够了。让 AI 严格遵守这套 tag 体系（提示词里告诉它）。

九、本章小结

Notion / Obsidian MCP 是知识库的"AI 入口"；
Fetch + Brave Search + Memory 三件套 = 个人研究员；
自动剪藏 + 自动总结的工作流，每天 5 分钟搞定信息流；
PDF / arXiv / Zotero MCP 适合学者 / 研究人员；
AI 写入要先进 Inbox，人工保留升级权。

十、动手任务（60 分钟）

任选其一：

A：装好 Notion MCP，让 AI 帮你把"今天浏览的 5 个网页"自动总结进 Notion；
B：搭好"AI 研究员"，做一次 30 分钟搞定"过去要 3 小时"的调研；
C：把你浏览器的"未读收藏夹"前 20 条 URL 喂给"自动剪藏工作流"，看看效果。

下一章，我们离开工作场景，进入"生活场景"——日程、出行、购物、健康。

第十一章：知识管理——Notion、Obsidian、网页抓取

一、为什么知识管理是 MCP 最被低估的场景

二、整体地图

三、Notion MCP

1. 装

2. 能做什么

3. 神级提示词

把搜索结果变成笔记

周报素材沉淀

客户档案管理

四、Obsidian MCP

1. 装

2. 能做什么

3. 神级提示词

自动建立双链

笔记复盘

五、Fetch + Brave Search + Memory：DIY 一个"AI 研究员"

配置

用法：让 AI 当你的"调研专家"

六、自动剪藏 + 自动总结的工作流

配置

工作流提示词

七、PDF / 论文 MCP

八、知识库设计的几条小建议

1. 三类页面 + 一类数据库

2. AI 默认写到 Inbox，再由你"挑"

3. tag 不要太多

九、本章小结

十、动手任务（60 分钟）