ORANGE BOOK · MCP

第十一章:知识管理——Notion、Obsidian、网页抓取


一、为什么知识管理是 MCP 最被低估的场景

很多人把知识管理理解成"做笔记",其实它真正的痛点是:

  1. 信息源太多:网页、推送、播客、邮件、群聊、PDF、视频;
  2. 搬运成本高:复制粘贴 + 整理格式 + 加 tag + 链接其他笔记;
  3. 沉淀缺位:今天看了一篇好文,三个月后想用却找不到;
  4. 检索失效:笔记越多越乱,最后"找笔记"比"看新内容"还累。

MCP 完美解决前三件—— 它让"信息源 → 知识库"这条路自动化、可重复、可扩展。


二、整体地图

flowchart LR
    classDef src fill:transparent,stroke-width:2px;
    classDef ai fill:transparent,stroke-width:2px;
    classDef kb fill:transparent,stroke-width:2px;

    subgraph Source [输入源]
      Web[网页 Fetch]:::src
      Search[搜索 Brave Search]:::src
      Mail[邮件 Gmail]:::src
      PDF[PDF 文件]:::src
      RSS[RSS Feed]:::src
    end

    subgraph AI [AI 处理]
      Sum[摘要 / 提炼]:::ai
      Tag[打标签 / 分类]:::ai
      Link[关联到既有笔记]:::ai
    end

    subgraph KB [知识库]
      Notion[Notion MCP]:::kb
      Obs[Obsidian MCP]:::kb
      Fs[Filesystem]:::kb
    end

    Web --> Sum --> Notion
    Search --> Sum --> Obs
    Mail --> Tag --> Notion
    PDF --> Sum --> Fs
    RSS --> Link --> Obs

不一定全装,但至少配 1 个知识库 + 1 个抓取源,立刻能用。


三、Notion MCP

1. 装

官方 MCP(远程,OAuth):

"notion": {
  "url": "https://mcp.notion.com",
  "auth": { "type": "oauth2" }
}

或本地 stdio + 自己的 integration token:

"notion": {
  "command": "npx",
  "args": ["-y", "@notionhq/notion-mcp-server"],
  "env": {
    "NOTION_TOKEN": "secret_xxx"
  }
}

第一次连,要把你想让 AI 操作的页面/数据库手动 Share 给 integration, 否则 AI 看不到(这是 Notion 自己的安全机制)。

2. 能做什么

  • 读 / 写页面;
  • 操作数据库(查、加行、改字段);
  • 创建子页面;
  • 修改属性 / 标签 / 状态。

3. 神级提示词

把搜索结果变成笔记

在网上搜 5 篇关于「软件工程师 30 岁后职业规划」的最有深度的文章, 每篇用 Fetch 抓全文,提炼 3 个观点 + 1 句最受启发的原文引用, 在我的 Notion『阅读笔记』数据库里建 5 条新页面, 标题用文章标题、tag 设为『职业发展』,作者字段填好。

周报素材沉淀

把我本周提交的所有 PR、写的所有文档、参加的所有会议, 统一汇总到 Notion『周报素材』页面,分『进展 / 反思 / 下周计划』三栏。

客户档案管理

这是今天和客户 X 通话的录音转写文本。 提炼出 5 个关键信息(需求 / 担忧 / 决策时间线 / 预算 / 关键人), 更新到 Notion 客户档案数据库 X 这一行; 历史对话追加到"沟通记录"长文本字段,按时间倒序。


四、Obsidian MCP

1. 装

社区版有几个,体验最好的:

"obsidian": {
  "command": "npx",
  "args": ["-y", "mcp-obsidian"],
  "env": {
    "OBSIDIAN_VAULT_PATH": "/Users/you/Documents/MyVault",
    "OBSIDIAN_API_KEY": "..."
  }
}

需要在 Obsidian 里装 "Local REST API" 插件,开 API。

2. 能做什么

  • 读 / 写笔记(markdown);
  • 创建双链 [[笔记名]];
  • 看 / 改 frontmatter;
  • 搜索笔记内容。

3. 神级提示词

自动建立双链

我刚写完一篇笔记 [[2026-04-19 MCP 学习总结]], 看一下我 Vault 里相关的笔记,自动在文末加一个『相关笔记』section, 列出 5 条最相关的双链。

笔记复盘

拉出过去 30 天我在 Obsidian 里写的所有日记, 分析重复出现的关键词、情绪走势、未完成的事项, 写一份『四月月度复盘』笔记。


五、Fetch + Brave Search + Memory:DIY 一个"AI 研究员"

配置

{
  "mcpServers": {
    "fetch": { "command": "uvx", "args": ["mcp-server-fetch"] },
    "brave-search": {
      "command": "npx",
      "args": ["-y", "@modelcontextprotocol/server-brave-search"],
      "env": { "BRAVE_API_KEY": "..." }
    },
    "memory": {
      "command": "npx",
      "args": ["-y", "@modelcontextprotocol/server-memory"]
    },
    "filesystem": {
      "command": "npx",
      "args": ["-y", "@modelcontextprotocol/server-filesystem", "/Users/you/research"]
    }
  }
}

用法:让 AI 当你的"调研专家"

我要写一篇关于"AI Agent 的商业模式演进"的深度文章。请你做研究员:

  1. 用 brave-search 搜出 10 篇 2025-2026 年高质量长文;
  2. 用 fetch 把每篇全文抓下来;
  3. 提炼每篇的 3 个核心观点 + 1 段最有价值的原文;
  4. 把所有原文 markdown 存到 ~/research/agent-business-model/
  5. 综合观点写成一份「研究备忘录」放到同目录;
  6. 把这篇研究的关键洞见和我个人的写作角度记到 memory 里。

整个过程 10 分钟。 这就是 2026 年"个人研究员"的常态。


六、自动剪藏 + 自动总结的工作流

每个人都遇到过:

  • 朋友圈分享的好文章,存了从来没看;
  • 浏览器收藏夹两万条,从来不打开;
  • 微信收藏里几千条,找不着。

下面这套工作流可以解决:

配置

fetch + filesystem + notion(或 obsidian)+ time

工作流提示词

这是我今天看到的一批 URL:

https://...
https://...
https://...

对每一条:

  1. 用 fetch 抓全文;
  2. 用 200 字写摘要 + 3 个 bullet points + 1 句金句;
  3. 自动判断分类(科技 / 商业 / 生活 / 哲学),打 tag;
  4. 在 Notion『阅读收藏』数据库建一行,URL、摘要、要点、tag、日期都填好;
  5. 列出今天哪几篇值得"晚上读全文"。

每天 5 分钟,把"剪藏 → 沉淀 → 复用"全自动化。


七、PDF / 论文 MCP

研究人员、学生、投资人会用到:

  • PDF MCP:让 AI 读 PDF 全文(不是只看前几页),可摘要、提取图表数据;
  • arXiv MCP:搜论文、看摘要、按引用数排序;
  • Zotero MCP(社区版):让 AI 维护你的文献库。

配置示例(PDF MCP):

"pdf": {
  "command": "uvx",
  "args": ["mcp-server-pdf"]
}

提示词:

把 ~/research/papers 文件夹里所有 PDF 各做一份 1 页摘要, 标题、作者、研究方法、核心结论、对我的工作启示, 写成一份合订本 markdown。


八、知识库设计的几条小建议

MCP 让"自动化"变得容易,但知识库结构本身仍然要你设计好。 否则会出现"AI 装了一肚子垃圾"的局面。

1. 三类页面 + 一类数据库

  • Inbox(收件箱):所有新内容先扔这里;
  • Permanent Notes(永久笔记):经过你二次加工的、可以长期复用的;
  • Maps of Content(索引页):按主题串起来的"目录";
  • 数据库:阅读收藏、人物 / 客户档案、项目进度、待办。

2. AI 默认写到 Inbox,再由你"挑"

不要让 AI 直接往 Permanent Notes 塞东西, 让它写到 Inbox,你每周 review 一次,决定哪些升级为永久笔记。

3. tag 不要太多

3-7 个一级 tag 就够了。 让 AI 严格遵守这套 tag 体系(提示词里告诉它)。


九、本章小结

  1. Notion / Obsidian MCP 是知识库的"AI 入口";
  2. Fetch + Brave Search + Memory 三件套 = 个人研究员;
  3. 自动剪藏 + 自动总结的工作流,每天 5 分钟搞定信息流;
  4. PDF / arXiv / Zotero MCP 适合学者 / 研究人员;
  5. AI 写入要先进 Inbox,人工保留升级权

十、动手任务(60 分钟)

任选其一:

  • A:装好 Notion MCP,让 AI 帮你把"今天浏览的 5 个网页"自动总结进 Notion;
  • B:搭好"AI 研究员",做一次 30 分钟搞定"过去要 3 小时"的调研;
  • C:把你浏览器的"未读收藏夹"前 20 条 URL 喂给"自动剪藏工作流",看看效果。

下一章,我们离开工作场景,进入"生活场景"——日程、出行、购物、健康。