ORANGE BOOK

第一章 AI 到底是什么——用大白话讲清楚


1.1 一句话讲清楚 AI 是什么

我先给你一句"普通人版"的 AI 定义。请你先看完这一句,再往下读:

AI(人工智能)就是一种能"听懂人话、能干活、能学习"的计算机程序。

就这一句。

你不需要记任何术语,你只需要记住这三个能力:

  1. 听懂人话——你用普通话/英文/任何一种语言跟它说话,它能理解你的意思(不像以前的程序,必须按规定格式输入)。
  2. 能干活——它不只是回答你"是/不是",它能帮你写文章、做表格、画图、写代码、分析数据⋯⋯
  3. 能学习——它的能力是通过"看了大量的数据"学出来的,而不是被人一行一行写代码"教"出来的。

这就是 AI 和你以前用过的所有程序最本质的区别。

举个对比:

类型 例子 你怎么用 它怎么"知道"该干啥
传统软件 Word、Excel、计算器 你必须按它规定的方式操作(比如点菜单、按按钮) 程序员一行一行写好的代码
早期 AI Siri、小爱同学(2022 年之前) 你必须用它"能听懂"的句式说话 程序员预先写好的"如果...就..."规则
现代 AI ChatGPT、豆包、DeepSeek(2022 年之后) 怎么说话都行,自然语言、有错别字、口语化⋯⋯都行 它"读"了人类几乎所有的公开知识,然后"自己悟出来"的

关键差别在最后一栏:现代 AI 的能力,不是被"写"出来的,是被"养"出来的。

这是一个革命性的变化。理解这一点,你就理解了 AI 的本质。


1.2 从三个比喻理解"现代 AI"

比喻一:AI 是一个读完了图书馆所有书的"超级实习生"

想象你公司新来了一个实习生。

这个实习生的特点是:

  • 学历超高:他高考状元,本科常春藤,硕士博士全读了。
  • 读过的东西比谁都多:他读完了人类历史上几乎所有的公开书籍、论文、网页、维基百科、知乎、微博⋯⋯(注意,是"几乎所有")。
  • 记忆力极强:你问他任何一个常识问题,他都能立刻答上来。
  • 工作积极:你让他干啥他就干啥,从不抱怨,从不偷懒,24 小时在线。
  • 态度极好:你骂他他不生气,你让他重做他不烦,你让他改 100 遍他还是耐心改。

但他也有几个致命缺点

  • 没工作经验:他读了很多书,但没真正"干过"什么事。所以他可能"知道"什么对,但"做出来"的东西未必合实际。
  • 会一本正经地胡说八道:他不知道答案的时候,会编一个看起来很专业的假答案出来——还说得头头是道,让你信以为真。
  • 不知道最近的事:他读的书是几个月前装订的,最近发生的事他不知道(除非你给他报纸看)。
  • 没有"个人意见":他什么立场都能站,看你想听什么他就讲什么——所以他给的建议你要自己判断。
  • 完全不记得你:每次和他说话都是第一次见——除非你专门给他一个笔记本(也就是"上下文"或"记忆"),他才能记住你。

这就是现代 AI 的本质:一个高学历、博览群书、24 小时待命、但缺乏经验、偶尔胡说、记性不好的"超级实习生"。

知道了这一点,你就知道:

  • 不要让他独自做"重大决策"——你做主,他给参考。
  • 不要 100% 相信他给的"事实"——重要的事情要交叉验证。
  • 要把背景信息告诉他——他不知道你是谁、你在干什么。
  • 把他当"实习生"用,而不是"老板"用——审稿权在你手上。

比喻二:AI 是一个"超级填空机"

如果你想再深入一层理解 AI,可以这么想:

AI 本质上是一个"猜下一个字"的程序。

是的,就这么简单——但你要把它想象到"极致"。

打个比方。如果我对你说:

"今天是星期一,我去____"

你大概率会猜:上班、上学、买菜、跑步⋯⋯

但你不会猜:跳楼、火星、消失。

为什么?因为你脑子里"今天是星期一,我去 X"这句话,有大量的语境告诉你 X 应该是什么样的词。

AI 也是这样。它"读"了人类几乎所有的文本,对"任何一句话的下一个字最可能是什么",有极强的判断力。

举个稍微复杂的例子:

"请帮我写一封请假邮件,我感冒了,想请明天一天假。 邮件内容:____"

AI 会一个字一个字地"猜"出这封邮件该怎么写——猜的时候,它会考虑:

  • 这是请假邮件,所以开头应该是"尊敬的 X 经理"
  • 因为感冒,所以中间要说明病情
  • 请一天假,所以要说"明天 4 月 20 日"
  • 邮件结尾要有"特此申请"、"望批准"等套话

它不是"知道"邮件该怎么写,它是根据见过的几百万封邮件,"猜"出下一个最合理的字

听起来很简单,但当这个"猜"做到极致——见过的语料足够多、模型足够大、训练足够久——这个"猜"就变成了一种近似于"理解"和"创造"的能力。

这就是 ChatGPT、豆包、DeepSeek 这些"大语言模型"的核心原理。

小知识:那个"超级填空机",技术上叫"大语言模型"(Large Language Model,简称 LLM)。"大"指的是参数多(动辄几百上千亿)、训练数据多(基本读完了整个互联网)。这本书里出现的几乎所有"AI",本质上都是 LLM。

比喻三:AI 是一个"什么都会的工具人"

第三个比喻,给你一个更有"操作感"的视角。

AI 不是一个"产品",是一个"通用工具"。

它就像一把瑞士军刀——可以是开瓶器、可以是螺丝刀、可以是剪刀、可以是锯子⋯⋯但它本身只是一块刀片。它干啥取决于你怎么用。

同一个 AI(比如豆包),你可以让它:

  • 作家:写小说、写剧本、写诗
  • 老师:教你数学、教你英语、教你物理
  • 医生(参考):解读体检报告、解释药品说明
  • 律师(参考):看合同条款、解释法律术语
  • 心理咨询师:陪你聊心事、分析情绪
  • 程序员:写代码、改 bug、做网页
  • 翻译:中英互译、地方方言识别
  • 设计师:写文案、画 logo、出海报方案
  • 营养师:定食谱、算热量、配三餐
  • 陪练:陪你练面试、练口语、练演讲

它的"角色"不是固定的——你跟它说"你现在是一个英语老师",它就变成英语老师;你说"你现在是一个 5 岁小朋友的妈妈",它就变成妈妈。

这就是为什么"提问的方式"决定了 AI 的能力——这也是为什么本书第 4、5 章要专门讲"提示词"。


1.3 AI 的简史——一段你需要知道的"故事"

虽然这本书不讲技术,但 AI 的简史能帮你理解"为什么 ChatGPT 是 2022 年才突然爆发的"。我们用 5 分钟讲完。

第一阶段:远古时期(1950s ~ 1970s)—— "AI" 这个词第一次被发明

1950 年,英国数学家阿兰·图灵(Alan Turing,电影《模仿游戏》男主角)写了一篇论文,问了一个问题:

"机器能不能思考?"

他还设计了一个测试(后来叫"图灵测试"):让一个人和一台机器分别对话,如果这个人分不出来对面是机器还是人,那这台机器就算"通过测试"。

1956 年,一群科学家在美国达特茅斯学院开了个会,给这个学科起了个名字:Artificial Intelligence(人工智能,简称 AI)

这个词从 1956 年用到今天,整整 70 年。

第二阶段:寒冬时期(1970s ~ 2000s)——大家发现"AI 不太行"

接下来三十多年,AI 经历了两次"寒冬"——意思是科学家觉得"AI 这条路好像走不通"。

为什么走不通?因为那时候的 AI 是专家系统——靠人写规则。比如让 AI 看病,就要请几百个医生坐下来,把"看到症状 X,就诊断 Y"这种规则一条一条写出来,写几十万条。

问题是:

  • 写规则太累了。
  • 现实情况太复杂,规则根本写不完。
  • 一旦有"规则没覆盖"的情况,AI 就完全傻掉。

所以那时候 AI 只能解决一些"很窄"的问题,比如下国际象棋。

第三阶段:转折点(2006 ~ 2017)——"深度学习"翻案

2006 年,加拿大的一个老教授杰弗里·辛顿(Geoffrey Hinton,2024 年诺贝尔物理学奖得主)提出了一个新方法:深度学习

简单讲,深度学习的思路是:别让人写规则了,让机器自己从数据里"看出规则"。

比如教 AI 认猫,过去要写"猫有四条腿、有胡子、有尾巴⋯⋯"几百条规则。深度学习的做法是:直接给 AI 看 1000 万张猫的照片,让它自己"悟"出猫长什么样。

效果惊人。2012 年,深度学习在图像识别比赛上把传统方法打得满地找牙。从此 AI 进入"深度学习时代"。

2016 年,谷歌的 AlphaGo 用深度学习击败了世界围棋冠军李世石——这是普通人第一次"感受到"AI 的厉害。

但这个阶段的 AI 还有个问题:专才。下围棋的 AI 不能开车,开车的 AI 不能聊天,聊天的 AI 不能识图。每个 AI 只能干一件事。

第四阶段:大模型时代(2017 ~ 2022)——通才 AI 诞生

2017 年,谷歌发表了一篇论文,标题是《Attention Is All You Need》(《注意力就是你需要的一切》)。这篇论文提出了一种新的 AI 架构,叫Transformer(变形金刚)。

Transformer 的厉害之处,是它能让 AI 同时处理任何一种"序列数据"——文字是序列、声音是序列、图片可以拆成序列、视频可以拆成序列、代码也是序列⋯⋯

这意味着:用同一个架构,可以训练出一个"什么都会"的 AI。

OpenAI 这家美国公司就是抓住了这个思路,从 2018 年开始连续训练了 GPT-1、GPT-2、GPT-3。

GPT 是什么意思?Generative Pre-trained Transformer——"生成式预训练变形金刚"。

每一代 GPT 都比上一代大一个数量级。GPT-3 的参数量达到了 1750 亿——这个规模在 2020 年是难以想象的。

GPT-3 已经能写文章、写代码、答问题、翻译、做总结⋯⋯几乎什么都能干。

但 GPT-3 当时只有程序员能用(要 API),普通人接触不到。

第五阶段:ChatGPT 时刻(2022 年 11 月 30 日)——AI 走进千家万户

2022 年 11 月 30 日,OpenAI 在 GPT-3.5 的基础上做了一个产品,叫 ChatGPT

它做了一件简单的事:给 GPT 加了一个聊天界面。普通人不用懂 API,打开网页就能用。

结果一发不可收拾:

  • 5 天用户破 100 万
  • 2 个月用户破 1 亿——成为人类历史上用户增长最快的产品(Facebook 用了 4.5 年达到 1 亿,TikTok 用了 9 个月)

从那天起,AI 进入了"全民时代"。

第六阶段:百模大战(2023 ~ 2025)——所有人都在做 AI

ChatGPT 的爆火,把全世界的科技公司都吓醒了。所有人都开始做自己的"大模型":

  • 国外:谷歌出 Gemini(前身叫 Bard),Anthropic 出 Claude(创始人是 OpenAI 离职的几位高管),Meta 出 Llama(开源模型,让小公司也能做 AI),马斯克的 xAI 出 Grok⋯⋯
  • 国内:百度出文心一言(最早,2023 年 3 月就发布了),阿里出通义千问,字节跳动出豆包,月之暗面出 Kimi,深度求索出 DeepSeek,智谱 AI 出 GLM/智谱清言,腾讯出元宝,华为出盘古,科大讯飞出讯飞星火⋯⋯

到 2025 年底,光是中国市场上"过审上线"的大模型就有 200 多个,这就是"百模大战"。

激烈的竞争让 AI 能力快速进化、价格快速下降、功能快速丰富——这是普通用户的福利。

第七阶段:现在(2026 年)——AI 进入"实用时代"

到了 2026 年,AI 已经从"能用"进化到"好用":

  • 多模态成为标配:你给 AI 一张图、一段语音、一个 PDF、甚至一段视频,它都能理解。
  • 推理能力大幅增强:以前 AI 只能"快速回答",现在 AI 会"先想再答"——比如 OpenAI 的 GPT-5 Thinking、DeepSeek-R 系列、Anthropic 的 Claude Thinking 模式,都能像人一样"深度思考"。
  • Agent(智能体)兴起:AI 不只是回答问题,还能"自己干活"——你给它一个目标(比如"帮我订一张下周去北京的火车票"),它能自己拆任务、自己上网、自己执行。
  • 价格暴跌:2023 年用一次 GPT-4 要几毛钱,2026 年同等能力的国产模型基本免费用。
  • 入口无处不在:手机预装、浏览器内置、办公软件集成——AI 不再是一个单独的 App,而是"长在每一个软件里"的能力。

所以,2026 年,是普通人开始用 AI 的最好时机。 工具够好,价格够低,门槛够低。


1.4 你需要知道的几个核心概念(用大白话)

下面这几个词,你后面会反复看到。这里用一句话讲清楚每个:

术语 大白话
AI(人工智能) 能听懂人话、能干活、能学习的计算机程序
大语言模型(LLM) 一种"什么都会"的 AI,本质是个"超级填空机"。ChatGPT、豆包、DeepSeek 都是 LLM
模型 AI 的"大脑"。比如 GPT-5、Claude 4、DeepSeek-V3、豆包 1.6 都是不同的"模型"
参数 模型"大脑"里的"突触"数量。一般越多越聪明(但也越费电费钱)
训练 让模型"读书学习"的过程,相当于把人养大
推理 你向 AI 提问、AI 回答你的过程。也叫"对话"、"调用"
Token AI 处理文本的"最小单位"。中文大约一个字 = 1.5~2 个 Token,英文一个单词 = 1 个 Token。你只需要知道:Token 越多,处理越慢、费用越高
上下文 AI 在和你对话时"能看到"的所有内容(你前面说的话 + AI 前面回的话 + 你上传的文件等)
上下文长度 AI 一次能"看到"多少内容。GPT-4 是 128K Token(约 10 万字),Claude 4 是 200K Token(约 15 万字),Gemini 是 100 万 Token(约 75 万字)
提示词(Prompt) 你跟 AI 说的话。学好"怎么说话"是用 AI 的核心技能
多模态 AI 能处理多种"媒介"——文字、图片、声音、视频。现在主流 AI 基本都是多模态的
幻觉(Hallucination) AI 一本正经地胡说八道。比如编一个不存在的人名、编一段不存在的法律条文、编一个错误的数学答案
RAG 一种让 AI"先查资料再回答"的技术。你不用懂细节,只需要知道:用 RAG 的 AI(比如开了"联网搜索"的 AI),幻觉会少很多
Agent(智能体) 不只回答问题、还能自己执行任务的 AI。比如"帮我订机票"、"帮我整理邮件"
微调(Fine-tuning) 在通用模型基础上,用专业数据"再训练"一下,让它更擅长某个领域。普通人一般用不到

请你不必背这些。 看到了大致知道是什么意思就行。后面每次出现,我们都会再用大白话讲一遍。


1.5 AI 能做什么——一份"30 件事"清单

这是最实用的一节。我列出 30 件普通人立刻就能让 AI 帮你做的事——按生活、学习、工作、创作四大类。

A. 生活类(10 件)

  1. 写各种"难写的话":道歉信、求助信、告别信、感谢信、给孩子的信、给老板请假的话术
  2. 看懂"看不懂的报告":体检报告、CT/MRI 报告、合同、保险条款、化验单、户型图
  3. 做菜:根据冰箱里现有的食材,给你 3 个菜谱 + 步骤 + 购物清单
  4. 健身:根据你的身高体重和目标,定制 4 周训练计划 + 饮食搭配
  5. 看病参考:把症状描述清楚,让 AI 帮你判断"是不是要去医院"、"应该挂什么科"
  6. 旅游攻略:3 天去哪里、玩什么、住哪、吃什么、预算多少,一次出全
  7. 购物决策:两个产品哪个更适合你?要不要现在买?等双 11 会更便宜吗?
  8. 育儿话术:5 岁孩子哭闹怎么办?孩子顶嘴怎么回应?青春期沟通怎么开口?
  9. 家庭关系:婆媳话术、夫妻沟通、应对七大姑八大姨、给父母讲一件他们不愿意接受的事
  10. 记账理财:给你的家庭做月度预算分析、消费习惯诊断、应急基金建议

B. 学习类(8 件)

  1. 拍照解题:拍下数学/物理/化学题,AI 给你详细讲解 + 思路 + 同类题
  2. 学英语口语:打开"语音通话",让 AI 当你的外教,每天聊 15 分钟
  3. 写论文/报告:给个题目和要求,AI 帮你列大纲、找资料、写初稿、改语病
  4. 总结长文档:100 页的 PDF,5 分钟出"读书笔记"
  5. 解释难懂的概念:"请用 5 岁小孩能听懂的话解释什么是相对论"
  6. 背单词/记知识点:让 AI 出题、批改、记录错题、再出针对性练习
  7. 学新技能:自学 Python、自学 PS、自学剪映、自学投资⋯⋯ AI 给你"30 天学习路径"
  8. 批改作文:让 AI 当语文/英语老师,逐句指出错误 + 给出改写版本

C. 工作类(7 件)

  1. 写周报/月报/年终总结:把素材丢给 AI,10 秒出 3 个版本任你选
  2. 做 PPT 大纲:给个主题,AI 出整套 PPT 大纲 + 每页内容 + 演讲稿
  3. 写邮件:求助、汇报、催促、道歉、辞职、跨部门协作⋯⋯任何场景的邮件
  4. 会议纪要:把会议录音转写后丢给 AI,5 分钟出"会议要点 + 行动项 + 责任人"
  5. Excel 公式:"如何在 A 列用公式实现 X 效果"——AI 直接给你公式
  6. 数据分析:把 Excel 表格丢给 AI,让它"找出关键趋势 + 异常值"
  7. 简历优化:你的简历 + 目标岗位 JD,AI 帮你匹配、改写、优化、生成英文版

D. 创作类(5 件)

  1. 写文案:朋友圈、小红书、抖音脚本、公众号、广告语⋯⋯
  2. 画图:头像、海报、表情包、概念图、商品图、儿童绘本插画
  3. 做视频:从写脚本、生成画面、配音、剪辑,全流程都能 AI
  4. 做音乐:5 分钟生成一首带歌词的原创歌曲
  5. 写小说/剧本:给个梗概,AI 帮你扩写成完整小说或剧本

这 30 件事,每一件都会在本书后面的章节里详细教你怎么做。 现在你只需要知道:AI 能做的事比你想象的多得多。


1.6 AI 不能做什么——四条"红线"

很多 AI 教程只讲 AI 的好,不讲 AI 的坏。但负责任的教程必须告诉你 AI 的"边界"——它在哪些事上"不靠谱",甚至"危险"。

红线一:AI 不能替代医生、律师、心理医生

AI 能给你参考信息,但不能给你专业诊断

  • AI 看 CT 报告,是帮你"听懂医生的话",不是代替医生诊断。
  • AI 看合同,是帮你"识别明显的坑",不是代替律师做法律意见。
  • AI 陪你聊心事,是帮你"理顺情绪",不是代替心理医生治疗抑郁症。

重大决策前,必须找真人专家。 AI 是助手,不是决策者。

红线二:AI 不知道"最近发生的事"(除非联网)

AI 模型有"知识截止日期"——比如 GPT-5 的训练数据截止到 2025 年某月,那之后发生的事它都不知道。

如果你问 "2026 年 4 月 20 号上海天气怎么样",AI 自己是不知道的——除非它打开了"联网搜索"。

重要的"时效性问题"(股价、航班、新闻、价格、政策、新出的产品),一定要让 AI 联网,或者你自己核实。

红线三:AI 会"一本正经地胡说八道"(幻觉)

这是最大的坑。

AI 不知道答案的时候,它不会说"我不知道"——它会编一个看起来很专业的假答案

举个真实案例:有个律师让 ChatGPT 帮他找几个判例,ChatGPT 给了 6 个判例(带案号、带法官姓名、带判决日期),律师拿去法庭引用——结果法官查了一下,6 个判例全是 AI 编的,根本不存在。这位律师被法院罚款,名声扫地。

任何"事实性、引用性"的内容(人名、日期、数据、法条、文献),都要交叉验证。

第十四章会专门讲"如何识别 AI 幻觉"。

红线四:AI 没有"价值观"和"判断力"

AI 学的是"人类说过的话",但人类说过的话有真有假、有善有恶、有对有错。AI 自己没有判断力

所以:

  • 你让 AI 帮你写"如何劝说前任复合",它会写——但这未必是对你好的事。
  • 你让 AI 帮你判断"这个人值不值得信任",它会答——但它根本不认识这个人。
  • 你让 AI 帮你做"重大人生决定"(结婚、离婚、辞职、移民),它会给建议——但最后做决定的应该是你自己

AI 是参谋,不是主帅。 主意永远是你自己的。


1.7 AI 和你听过的那些"AI"有什么区别

普通人听过的"AI"概念其实很多,容易混淆。一张表讲清:

你听过的词 是什么 和"我们说的 AI"的关系
大数据 海量数据的分析处理 是 AI 的"原料"。AI 是吃了大量数据训练出来的
机器学习 一种让机器从数据里学规律的方法 是 AI 的"骨架方法"。深度学习是机器学习的一种
深度学习 用"神经网络"做的机器学习 现代 AI 的核心方法。ChatGPT 就是用深度学习做的
神经网络 模仿人脑神经元结构的数学模型 深度学习的具体形式
大模型 参数量极大的深度学习模型 现代 AI 的主流形态。本书的"AI" ≈ 大模型
LLM(大语言模型) 专门处理"语言"的大模型 ChatGPT、豆包、DeepSeek 都是 LLM
Transformer 一种神经网络架构 现在几乎所有大模型都用这个架构
GPT OpenAI 公司的 LLM 系列 是 LLM 的一个具体产品
AGI(通用人工智能) 未来设想的"和人一样聪明的 AI" 现在还没有,但 OpenAI 等公司正在朝这个目标走
AIGC(生成式 AI) 能"生成"内容的 AI(文字、图、视频、音乐) 现在主流 AI 都属于这一类
Agent(智能体) 能自主执行任务的 AI 是大模型加上"工具能力"的产品形态

这一节看不太懂没关系。你只需要记住一句话:本书里说的"AI",默认指 ChatGPT、豆包、DeepSeek 这种"大语言模型"。


1.8 一个常见的疑问:AI 真的"懂"我说的话吗?

很多人会问:AI 是真的"理解"了我,还是只是"看起来像"理解?

这是一个哲学问题,也是一个技术问题。我给你两个不同视角的答案:

视角一:技术派的回答——它"不懂"

技术派会告诉你:AI 本质上就是个"猜下一个字"的程序,它没有"理解"——它只是基于统计学找出最可能的下一个词。

按这个视角,AI 没有"意识",没有"思考",没有"懂"——它只是在做高级的"模式匹配"。

视角二:实用派的回答——管它懂不懂,能用就行

实用派会告诉你:哲学问题留给哲学家,对普通用户来说,只要它"表现得像懂",对你来说就是"懂"

你问它"我心情不好怎么办",它给你一段贴心的安慰,让你感觉好多了——这时候它"是不是真懂"重要吗?

你让它写一份周报,它给你一份逻辑清晰、用词得当的周报——这时候它"是不是真理解你的工作"重要吗?

实用派的视角是:AI 是工具,能用、好用、解决问题,就够了。

我的建议:站在实用派一边,但保留一份警惕

我建议你:

  • 使用时:把它当"懂你的助手",正常用、放心用。
  • 关键决策时:记住它"可能不懂"——它的答案可能漂亮但没有真实理解,所以重要的事自己核实。

这是一个微妙的平衡。本书后面会反复教你这个平衡感。


1.9 一个测试:你现在对 AI 的认知到了哪一层

下面是一个 5 道题的"自测"。请你在心里回答:"是 / 否 / 不确定"。

  1. AI 能听懂我用大白话提的问题吗?
  2. AI 给出的答案,我可以无条件相信吗?
  3. AI 知道今天的新闻吗?
  4. AI 是真的"思考"过才回答的吗?
  5. AI 能记得我上周和它说过什么吗?

正确答案

  1. (这是现代 AI 和早期 AI 最大的差别)。
  2. 不能(要警惕幻觉,重要事项要核实)。
  3. 看情况——它"自己"的知识有截止日期;如果它能"联网",就能查到今天的新闻。
  4. 看模型——普通模型是"快速回答";带"Thinking"、"R1"、"O1"等字样的模型会"先思考再回答"。
  5. 看产品——大部分 AI 默认每次对话是独立的(开新对话就忘了);少数 AI(如 ChatGPT、豆包、Kimi)开了"记忆"功能后能记住你。

如果你 5 题都答对了,那你的 AI 认知已经到达入门毕业的水平。

如果有错的,没关系——后面的章节会反复加深这些点。


本章小抄

AI 是什么?
└─ 一种能"听懂人话、能干活、能学习"的计算机程序

现代 AI 的本质?
└─ 大语言模型(LLM)= 一个读完了图书馆所有书的"超级填空机"

AI 简史一句话?
└─ 1956 年起步 → 几十年寒冬 → 2012 深度学习 → 2017 Transformer
   → 2022.11.30 ChatGPT 引爆全民 → 2026 实用时代

AI 能做的 30 件事?
└─ 生活 10、学习 8、工作 7、创作 5(详见 1.5 节,后面每章细讲)

AI 的四条红线?
1. 不能替代医生/律师/心理医生
2. 不知道最近发生的事(除非联网)
3. 会"一本正经地胡说八道"(幻觉)
4. 没有价值观和判断力(最终决策权在你)

学 AI 最重要的能力?
└─ 不是技术,是"沟通"——会和 AI "说话"的人,AI 用得好

5 分钟动手实验

打开任何一个你能用的 AI 工具(ChatGPT、Claude、Gemini、豆包、DeepSeek、Kimi、文心一言、通义千问、智谱清言⋯⋯随便哪个),把下面这段话原样复制进去,看看会发生什么:

你好!我刚看完一本关于 AI 的书的第一章,请你做以下三件事:

1. 用一个 8 岁小朋友能听懂的比喻,解释什么是"大语言模型"。
2. 给我 3 个普通人立刻能用 AI 解决的"小事"举例(不要太常规的)。
3. 告诉我一个 AI 容易"出错"的场景,让我引以为戒。

要求:每一项不超过 100 字,分点回答。

观察重点

  • 它是否听懂了你的请求?
  • 它的回答有没有"令你眼前一亮"的地方?
  • 三个回答里,哪个最有启发?哪个最像"凑数的"?

把这次对话截图保存——这是你和 AI 关系的"第一张合影"。


下章预告

下一章 第二章 2026 年 AI 工具全景图,我们带你俯瞰一下 2026 年的 AI 江湖:

  • 国外的"四大金刚":ChatGPT、Claude、Gemini、Grok 各自什么定位
  • 国内的"六大主流":豆包、DeepSeek、Kimi、文心一言、通义千问、智谱清言怎么选
  • 专业垂直工具:Midjourney、Sora、Runway、Suno⋯⋯什么时候用
  • 一份"决策树":根据你的需求和预算,告诉你该选哪一个

读完第二章,你就再也不会"AI 那么多,不知道用哪个"。