1.1 一句话讲清楚 AI 是什么
我先给你一句"普通人版"的 AI 定义。请你先看完这一句,再往下读:
AI(人工智能)就是一种能"听懂人话、能干活、能学习"的计算机程序。
就这一句。
你不需要记任何术语,你只需要记住这三个能力:
- 听懂人话——你用普通话/英文/任何一种语言跟它说话,它能理解你的意思(不像以前的程序,必须按规定格式输入)。
- 能干活——它不只是回答你"是/不是",它能帮你写文章、做表格、画图、写代码、分析数据⋯⋯
- 能学习——它的能力是通过"看了大量的数据"学出来的,而不是被人一行一行写代码"教"出来的。
这就是 AI 和你以前用过的所有程序最本质的区别。
举个对比:
| 类型 | 例子 | 你怎么用 | 它怎么"知道"该干啥 |
|---|---|---|---|
| 传统软件 | Word、Excel、计算器 | 你必须按它规定的方式操作(比如点菜单、按按钮) | 程序员一行一行写好的代码 |
| 早期 AI | Siri、小爱同学(2022 年之前) | 你必须用它"能听懂"的句式说话 | 程序员预先写好的"如果...就..."规则 |
| 现代 AI | ChatGPT、豆包、DeepSeek(2022 年之后) | 你怎么说话都行,自然语言、有错别字、口语化⋯⋯都行 | 它"读"了人类几乎所有的公开知识,然后"自己悟出来"的 |
关键差别在最后一栏:现代 AI 的能力,不是被"写"出来的,是被"养"出来的。
这是一个革命性的变化。理解这一点,你就理解了 AI 的本质。
1.2 从三个比喻理解"现代 AI"
比喻一:AI 是一个读完了图书馆所有书的"超级实习生"
想象你公司新来了一个实习生。
这个实习生的特点是:
- 学历超高:他高考状元,本科常春藤,硕士博士全读了。
- 读过的东西比谁都多:他读完了人类历史上几乎所有的公开书籍、论文、网页、维基百科、知乎、微博⋯⋯(注意,是"几乎所有")。
- 记忆力极强:你问他任何一个常识问题,他都能立刻答上来。
- 工作积极:你让他干啥他就干啥,从不抱怨,从不偷懒,24 小时在线。
- 态度极好:你骂他他不生气,你让他重做他不烦,你让他改 100 遍他还是耐心改。
但他也有几个致命缺点:
- 没工作经验:他读了很多书,但没真正"干过"什么事。所以他可能"知道"什么对,但"做出来"的东西未必合实际。
- 会一本正经地胡说八道:他不知道答案的时候,会编一个看起来很专业的假答案出来——还说得头头是道,让你信以为真。
- 不知道最近的事:他读的书是几个月前装订的,最近发生的事他不知道(除非你给他报纸看)。
- 没有"个人意见":他什么立场都能站,看你想听什么他就讲什么——所以他给的建议你要自己判断。
- 完全不记得你:每次和他说话都是第一次见——除非你专门给他一个笔记本(也就是"上下文"或"记忆"),他才能记住你。
这就是现代 AI 的本质:一个高学历、博览群书、24 小时待命、但缺乏经验、偶尔胡说、记性不好的"超级实习生"。
知道了这一点,你就知道:
- 不要让他独自做"重大决策"——你做主,他给参考。
- 不要 100% 相信他给的"事实"——重要的事情要交叉验证。
- 要把背景信息告诉他——他不知道你是谁、你在干什么。
- 把他当"实习生"用,而不是"老板"用——审稿权在你手上。
比喻二:AI 是一个"超级填空机"
如果你想再深入一层理解 AI,可以这么想:
AI 本质上是一个"猜下一个字"的程序。
是的,就这么简单——但你要把它想象到"极致"。
打个比方。如果我对你说:
"今天是星期一,我去____"
你大概率会猜:上班、上学、买菜、跑步⋯⋯
但你不会猜:跳楼、火星、消失。
为什么?因为你脑子里"今天是星期一,我去 X"这句话,有大量的语境告诉你 X 应该是什么样的词。
AI 也是这样。它"读"了人类几乎所有的文本,对"任何一句话的下一个字最可能是什么",有极强的判断力。
举个稍微复杂的例子:
"请帮我写一封请假邮件,我感冒了,想请明天一天假。 邮件内容:____"
AI 会一个字一个字地"猜"出这封邮件该怎么写——猜的时候,它会考虑:
- 这是请假邮件,所以开头应该是"尊敬的 X 经理"
- 因为感冒,所以中间要说明病情
- 请一天假,所以要说"明天 4 月 20 日"
- 邮件结尾要有"特此申请"、"望批准"等套话
它不是"知道"邮件该怎么写,它是根据见过的几百万封邮件,"猜"出下一个最合理的字。
听起来很简单,但当这个"猜"做到极致——见过的语料足够多、模型足够大、训练足够久——这个"猜"就变成了一种近似于"理解"和"创造"的能力。
这就是 ChatGPT、豆包、DeepSeek 这些"大语言模型"的核心原理。
小知识:那个"超级填空机",技术上叫"大语言模型"(Large Language Model,简称 LLM)。"大"指的是参数多(动辄几百上千亿)、训练数据多(基本读完了整个互联网)。这本书里出现的几乎所有"AI",本质上都是 LLM。
比喻三:AI 是一个"什么都会的工具人"
第三个比喻,给你一个更有"操作感"的视角。
AI 不是一个"产品",是一个"通用工具"。
它就像一把瑞士军刀——可以是开瓶器、可以是螺丝刀、可以是剪刀、可以是锯子⋯⋯但它本身只是一块刀片。它干啥取决于你怎么用。
同一个 AI(比如豆包),你可以让它:
- 当作家:写小说、写剧本、写诗
- 当老师:教你数学、教你英语、教你物理
- 当医生(参考):解读体检报告、解释药品说明
- 当律师(参考):看合同条款、解释法律术语
- 当心理咨询师:陪你聊心事、分析情绪
- 当程序员:写代码、改 bug、做网页
- 当翻译:中英互译、地方方言识别
- 当设计师:写文案、画 logo、出海报方案
- 当营养师:定食谱、算热量、配三餐
- 当陪练:陪你练面试、练口语、练演讲
它的"角色"不是固定的——你跟它说"你现在是一个英语老师",它就变成英语老师;你说"你现在是一个 5 岁小朋友的妈妈",它就变成妈妈。
这就是为什么"提问的方式"决定了 AI 的能力——这也是为什么本书第 4、5 章要专门讲"提示词"。
1.3 AI 的简史——一段你需要知道的"故事"
虽然这本书不讲技术,但 AI 的简史能帮你理解"为什么 ChatGPT 是 2022 年才突然爆发的"。我们用 5 分钟讲完。
第一阶段:远古时期(1950s ~ 1970s)—— "AI" 这个词第一次被发明
1950 年,英国数学家阿兰·图灵(Alan Turing,电影《模仿游戏》男主角)写了一篇论文,问了一个问题:
"机器能不能思考?"
他还设计了一个测试(后来叫"图灵测试"):让一个人和一台机器分别对话,如果这个人分不出来对面是机器还是人,那这台机器就算"通过测试"。
1956 年,一群科学家在美国达特茅斯学院开了个会,给这个学科起了个名字:Artificial Intelligence(人工智能,简称 AI)。
这个词从 1956 年用到今天,整整 70 年。
第二阶段:寒冬时期(1970s ~ 2000s)——大家发现"AI 不太行"
接下来三十多年,AI 经历了两次"寒冬"——意思是科学家觉得"AI 这条路好像走不通"。
为什么走不通?因为那时候的 AI 是专家系统——靠人写规则。比如让 AI 看病,就要请几百个医生坐下来,把"看到症状 X,就诊断 Y"这种规则一条一条写出来,写几十万条。
问题是:
- 写规则太累了。
- 现实情况太复杂,规则根本写不完。
- 一旦有"规则没覆盖"的情况,AI 就完全傻掉。
所以那时候 AI 只能解决一些"很窄"的问题,比如下国际象棋。
第三阶段:转折点(2006 ~ 2017)——"深度学习"翻案
2006 年,加拿大的一个老教授杰弗里·辛顿(Geoffrey Hinton,2024 年诺贝尔物理学奖得主)提出了一个新方法:深度学习。
简单讲,深度学习的思路是:别让人写规则了,让机器自己从数据里"看出规则"。
比如教 AI 认猫,过去要写"猫有四条腿、有胡子、有尾巴⋯⋯"几百条规则。深度学习的做法是:直接给 AI 看 1000 万张猫的照片,让它自己"悟"出猫长什么样。
效果惊人。2012 年,深度学习在图像识别比赛上把传统方法打得满地找牙。从此 AI 进入"深度学习时代"。
2016 年,谷歌的 AlphaGo 用深度学习击败了世界围棋冠军李世石——这是普通人第一次"感受到"AI 的厉害。
但这个阶段的 AI 还有个问题:专才。下围棋的 AI 不能开车,开车的 AI 不能聊天,聊天的 AI 不能识图。每个 AI 只能干一件事。
第四阶段:大模型时代(2017 ~ 2022)——通才 AI 诞生
2017 年,谷歌发表了一篇论文,标题是《Attention Is All You Need》(《注意力就是你需要的一切》)。这篇论文提出了一种新的 AI 架构,叫Transformer(变形金刚)。
Transformer 的厉害之处,是它能让 AI 同时处理任何一种"序列数据"——文字是序列、声音是序列、图片可以拆成序列、视频可以拆成序列、代码也是序列⋯⋯
这意味着:用同一个架构,可以训练出一个"什么都会"的 AI。
OpenAI 这家美国公司就是抓住了这个思路,从 2018 年开始连续训练了 GPT-1、GPT-2、GPT-3。
GPT 是什么意思?Generative Pre-trained Transformer——"生成式预训练变形金刚"。
每一代 GPT 都比上一代大一个数量级。GPT-3 的参数量达到了 1750 亿——这个规模在 2020 年是难以想象的。
GPT-3 已经能写文章、写代码、答问题、翻译、做总结⋯⋯几乎什么都能干。
但 GPT-3 当时只有程序员能用(要 API),普通人接触不到。
第五阶段:ChatGPT 时刻(2022 年 11 月 30 日)——AI 走进千家万户
2022 年 11 月 30 日,OpenAI 在 GPT-3.5 的基础上做了一个产品,叫 ChatGPT。
它做了一件简单的事:给 GPT 加了一个聊天界面。普通人不用懂 API,打开网页就能用。
结果一发不可收拾:
- 5 天用户破 100 万
- 2 个月用户破 1 亿——成为人类历史上用户增长最快的产品(Facebook 用了 4.5 年达到 1 亿,TikTok 用了 9 个月)
从那天起,AI 进入了"全民时代"。
第六阶段:百模大战(2023 ~ 2025)——所有人都在做 AI
ChatGPT 的爆火,把全世界的科技公司都吓醒了。所有人都开始做自己的"大模型":
- 国外:谷歌出 Gemini(前身叫 Bard),Anthropic 出 Claude(创始人是 OpenAI 离职的几位高管),Meta 出 Llama(开源模型,让小公司也能做 AI),马斯克的 xAI 出 Grok⋯⋯
- 国内:百度出文心一言(最早,2023 年 3 月就发布了),阿里出通义千问,字节跳动出豆包,月之暗面出 Kimi,深度求索出 DeepSeek,智谱 AI 出 GLM/智谱清言,腾讯出元宝,华为出盘古,科大讯飞出讯飞星火⋯⋯
到 2025 年底,光是中国市场上"过审上线"的大模型就有 200 多个,这就是"百模大战"。
激烈的竞争让 AI 能力快速进化、价格快速下降、功能快速丰富——这是普通用户的福利。
第七阶段:现在(2026 年)——AI 进入"实用时代"
到了 2026 年,AI 已经从"能用"进化到"好用":
- 多模态成为标配:你给 AI 一张图、一段语音、一个 PDF、甚至一段视频,它都能理解。
- 推理能力大幅增强:以前 AI 只能"快速回答",现在 AI 会"先想再答"——比如 OpenAI 的 GPT-5 Thinking、DeepSeek-R 系列、Anthropic 的 Claude Thinking 模式,都能像人一样"深度思考"。
- Agent(智能体)兴起:AI 不只是回答问题,还能"自己干活"——你给它一个目标(比如"帮我订一张下周去北京的火车票"),它能自己拆任务、自己上网、自己执行。
- 价格暴跌:2023 年用一次 GPT-4 要几毛钱,2026 年同等能力的国产模型基本免费用。
- 入口无处不在:手机预装、浏览器内置、办公软件集成——AI 不再是一个单独的 App,而是"长在每一个软件里"的能力。
所以,2026 年,是普通人开始用 AI 的最好时机。 工具够好,价格够低,门槛够低。
1.4 你需要知道的几个核心概念(用大白话)
下面这几个词,你后面会反复看到。这里用一句话讲清楚每个:
| 术语 | 大白话 |
|---|---|
| AI(人工智能) | 能听懂人话、能干活、能学习的计算机程序 |
| 大语言模型(LLM) | 一种"什么都会"的 AI,本质是个"超级填空机"。ChatGPT、豆包、DeepSeek 都是 LLM |
| 模型 | AI 的"大脑"。比如 GPT-5、Claude 4、DeepSeek-V3、豆包 1.6 都是不同的"模型" |
| 参数 | 模型"大脑"里的"突触"数量。一般越多越聪明(但也越费电费钱) |
| 训练 | 让模型"读书学习"的过程,相当于把人养大 |
| 推理 | 你向 AI 提问、AI 回答你的过程。也叫"对话"、"调用" |
| Token | AI 处理文本的"最小单位"。中文大约一个字 = 1.5~2 个 Token,英文一个单词 = 1 个 Token。你只需要知道:Token 越多,处理越慢、费用越高 |
| 上下文 | AI 在和你对话时"能看到"的所有内容(你前面说的话 + AI 前面回的话 + 你上传的文件等) |
| 上下文长度 | AI 一次能"看到"多少内容。GPT-4 是 128K Token(约 10 万字),Claude 4 是 200K Token(约 15 万字),Gemini 是 100 万 Token(约 75 万字) |
| 提示词(Prompt) | 你跟 AI 说的话。学好"怎么说话"是用 AI 的核心技能 |
| 多模态 | AI 能处理多种"媒介"——文字、图片、声音、视频。现在主流 AI 基本都是多模态的 |
| 幻觉(Hallucination) | AI 一本正经地胡说八道。比如编一个不存在的人名、编一段不存在的法律条文、编一个错误的数学答案 |
| RAG | 一种让 AI"先查资料再回答"的技术。你不用懂细节,只需要知道:用 RAG 的 AI(比如开了"联网搜索"的 AI),幻觉会少很多 |
| Agent(智能体) | 不只回答问题、还能自己执行任务的 AI。比如"帮我订机票"、"帮我整理邮件" |
| 微调(Fine-tuning) | 在通用模型基础上,用专业数据"再训练"一下,让它更擅长某个领域。普通人一般用不到 |
请你不必背这些。 看到了大致知道是什么意思就行。后面每次出现,我们都会再用大白话讲一遍。
1.5 AI 能做什么——一份"30 件事"清单
这是最实用的一节。我列出 30 件普通人立刻就能让 AI 帮你做的事——按生活、学习、工作、创作四大类。
A. 生活类(10 件)
- 写各种"难写的话":道歉信、求助信、告别信、感谢信、给孩子的信、给老板请假的话术
- 看懂"看不懂的报告":体检报告、CT/MRI 报告、合同、保险条款、化验单、户型图
- 做菜:根据冰箱里现有的食材,给你 3 个菜谱 + 步骤 + 购物清单
- 健身:根据你的身高体重和目标,定制 4 周训练计划 + 饮食搭配
- 看病参考:把症状描述清楚,让 AI 帮你判断"是不是要去医院"、"应该挂什么科"
- 旅游攻略:3 天去哪里、玩什么、住哪、吃什么、预算多少,一次出全
- 购物决策:两个产品哪个更适合你?要不要现在买?等双 11 会更便宜吗?
- 育儿话术:5 岁孩子哭闹怎么办?孩子顶嘴怎么回应?青春期沟通怎么开口?
- 家庭关系:婆媳话术、夫妻沟通、应对七大姑八大姨、给父母讲一件他们不愿意接受的事
- 记账理财:给你的家庭做月度预算分析、消费习惯诊断、应急基金建议
B. 学习类(8 件)
- 拍照解题:拍下数学/物理/化学题,AI 给你详细讲解 + 思路 + 同类题
- 学英语口语:打开"语音通话",让 AI 当你的外教,每天聊 15 分钟
- 写论文/报告:给个题目和要求,AI 帮你列大纲、找资料、写初稿、改语病
- 总结长文档:100 页的 PDF,5 分钟出"读书笔记"
- 解释难懂的概念:"请用 5 岁小孩能听懂的话解释什么是相对论"
- 背单词/记知识点:让 AI 出题、批改、记录错题、再出针对性练习
- 学新技能:自学 Python、自学 PS、自学剪映、自学投资⋯⋯ AI 给你"30 天学习路径"
- 批改作文:让 AI 当语文/英语老师,逐句指出错误 + 给出改写版本
C. 工作类(7 件)
- 写周报/月报/年终总结:把素材丢给 AI,10 秒出 3 个版本任你选
- 做 PPT 大纲:给个主题,AI 出整套 PPT 大纲 + 每页内容 + 演讲稿
- 写邮件:求助、汇报、催促、道歉、辞职、跨部门协作⋯⋯任何场景的邮件
- 会议纪要:把会议录音转写后丢给 AI,5 分钟出"会议要点 + 行动项 + 责任人"
- Excel 公式:"如何在 A 列用公式实现 X 效果"——AI 直接给你公式
- 数据分析:把 Excel 表格丢给 AI,让它"找出关键趋势 + 异常值"
- 简历优化:你的简历 + 目标岗位 JD,AI 帮你匹配、改写、优化、生成英文版
D. 创作类(5 件)
- 写文案:朋友圈、小红书、抖音脚本、公众号、广告语⋯⋯
- 画图:头像、海报、表情包、概念图、商品图、儿童绘本插画
- 做视频:从写脚本、生成画面、配音、剪辑,全流程都能 AI
- 做音乐:5 分钟生成一首带歌词的原创歌曲
- 写小说/剧本:给个梗概,AI 帮你扩写成完整小说或剧本
这 30 件事,每一件都会在本书后面的章节里详细教你怎么做。 现在你只需要知道:AI 能做的事比你想象的多得多。
1.6 AI 不能做什么——四条"红线"
很多 AI 教程只讲 AI 的好,不讲 AI 的坏。但负责任的教程必须告诉你 AI 的"边界"——它在哪些事上"不靠谱",甚至"危险"。
红线一:AI 不能替代医生、律师、心理医生
AI 能给你参考信息,但不能给你专业诊断。
- AI 看 CT 报告,是帮你"听懂医生的话",不是代替医生诊断。
- AI 看合同,是帮你"识别明显的坑",不是代替律师做法律意见。
- AI 陪你聊心事,是帮你"理顺情绪",不是代替心理医生治疗抑郁症。
重大决策前,必须找真人专家。 AI 是助手,不是决策者。
红线二:AI 不知道"最近发生的事"(除非联网)
AI 模型有"知识截止日期"——比如 GPT-5 的训练数据截止到 2025 年某月,那之后发生的事它都不知道。
如果你问 "2026 年 4 月 20 号上海天气怎么样",AI 自己是不知道的——除非它打开了"联网搜索"。
重要的"时效性问题"(股价、航班、新闻、价格、政策、新出的产品),一定要让 AI 联网,或者你自己核实。
红线三:AI 会"一本正经地胡说八道"(幻觉)
这是最大的坑。
AI 不知道答案的时候,它不会说"我不知道"——它会编一个看起来很专业的假答案。
举个真实案例:有个律师让 ChatGPT 帮他找几个判例,ChatGPT 给了 6 个判例(带案号、带法官姓名、带判决日期),律师拿去法庭引用——结果法官查了一下,6 个判例全是 AI 编的,根本不存在。这位律师被法院罚款,名声扫地。
任何"事实性、引用性"的内容(人名、日期、数据、法条、文献),都要交叉验证。
第十四章会专门讲"如何识别 AI 幻觉"。
红线四:AI 没有"价值观"和"判断力"
AI 学的是"人类说过的话",但人类说过的话有真有假、有善有恶、有对有错。AI 自己没有判断力。
所以:
- 你让 AI 帮你写"如何劝说前任复合",它会写——但这未必是对你好的事。
- 你让 AI 帮你判断"这个人值不值得信任",它会答——但它根本不认识这个人。
- 你让 AI 帮你做"重大人生决定"(结婚、离婚、辞职、移民),它会给建议——但最后做决定的应该是你自己。
AI 是参谋,不是主帅。 主意永远是你自己的。
1.7 AI 和你听过的那些"AI"有什么区别
普通人听过的"AI"概念其实很多,容易混淆。一张表讲清:
| 你听过的词 | 是什么 | 和"我们说的 AI"的关系 |
|---|---|---|
| 大数据 | 海量数据的分析处理 | 是 AI 的"原料"。AI 是吃了大量数据训练出来的 |
| 机器学习 | 一种让机器从数据里学规律的方法 | 是 AI 的"骨架方法"。深度学习是机器学习的一种 |
| 深度学习 | 用"神经网络"做的机器学习 | 现代 AI 的核心方法。ChatGPT 就是用深度学习做的 |
| 神经网络 | 模仿人脑神经元结构的数学模型 | 深度学习的具体形式 |
| 大模型 | 参数量极大的深度学习模型 | 现代 AI 的主流形态。本书的"AI" ≈ 大模型 |
| LLM(大语言模型) | 专门处理"语言"的大模型 | ChatGPT、豆包、DeepSeek 都是 LLM |
| Transformer | 一种神经网络架构 | 现在几乎所有大模型都用这个架构 |
| GPT | OpenAI 公司的 LLM 系列 | 是 LLM 的一个具体产品 |
| AGI(通用人工智能) | 未来设想的"和人一样聪明的 AI" | 现在还没有,但 OpenAI 等公司正在朝这个目标走 |
| AIGC(生成式 AI) | 能"生成"内容的 AI(文字、图、视频、音乐) | 现在主流 AI 都属于这一类 |
| Agent(智能体) | 能自主执行任务的 AI | 是大模型加上"工具能力"的产品形态 |
这一节看不太懂没关系。你只需要记住一句话:本书里说的"AI",默认指 ChatGPT、豆包、DeepSeek 这种"大语言模型"。
1.8 一个常见的疑问:AI 真的"懂"我说的话吗?
很多人会问:AI 是真的"理解"了我,还是只是"看起来像"理解?
这是一个哲学问题,也是一个技术问题。我给你两个不同视角的答案:
视角一:技术派的回答——它"不懂"
技术派会告诉你:AI 本质上就是个"猜下一个字"的程序,它没有"理解"——它只是基于统计学找出最可能的下一个词。
按这个视角,AI 没有"意识",没有"思考",没有"懂"——它只是在做高级的"模式匹配"。
视角二:实用派的回答——管它懂不懂,能用就行
实用派会告诉你:哲学问题留给哲学家,对普通用户来说,只要它"表现得像懂",对你来说就是"懂"。
你问它"我心情不好怎么办",它给你一段贴心的安慰,让你感觉好多了——这时候它"是不是真懂"重要吗?
你让它写一份周报,它给你一份逻辑清晰、用词得当的周报——这时候它"是不是真理解你的工作"重要吗?
实用派的视角是:AI 是工具,能用、好用、解决问题,就够了。
我的建议:站在实用派一边,但保留一份警惕
我建议你:
- 使用时:把它当"懂你的助手",正常用、放心用。
- 关键决策时:记住它"可能不懂"——它的答案可能漂亮但没有真实理解,所以重要的事自己核实。
这是一个微妙的平衡。本书后面会反复教你这个平衡感。
1.9 一个测试:你现在对 AI 的认知到了哪一层
下面是一个 5 道题的"自测"。请你在心里回答:"是 / 否 / 不确定"。
- AI 能听懂我用大白话提的问题吗?
- AI 给出的答案,我可以无条件相信吗?
- AI 知道今天的新闻吗?
- AI 是真的"思考"过才回答的吗?
- AI 能记得我上周和它说过什么吗?
正确答案:
- 能(这是现代 AI 和早期 AI 最大的差别)。
- 不能(要警惕幻觉,重要事项要核实)。
- 看情况——它"自己"的知识有截止日期;如果它能"联网",就能查到今天的新闻。
- 看模型——普通模型是"快速回答";带"Thinking"、"R1"、"O1"等字样的模型会"先思考再回答"。
- 看产品——大部分 AI 默认每次对话是独立的(开新对话就忘了);少数 AI(如 ChatGPT、豆包、Kimi)开了"记忆"功能后能记住你。
如果你 5 题都答对了,那你的 AI 认知已经到达入门毕业的水平。
如果有错的,没关系——后面的章节会反复加深这些点。
本章小抄
AI 是什么?
└─ 一种能"听懂人话、能干活、能学习"的计算机程序
现代 AI 的本质?
└─ 大语言模型(LLM)= 一个读完了图书馆所有书的"超级填空机"
AI 简史一句话?
└─ 1956 年起步 → 几十年寒冬 → 2012 深度学习 → 2017 Transformer
→ 2022.11.30 ChatGPT 引爆全民 → 2026 实用时代
AI 能做的 30 件事?
└─ 生活 10、学习 8、工作 7、创作 5(详见 1.5 节,后面每章细讲)
AI 的四条红线?
1. 不能替代医生/律师/心理医生
2. 不知道最近发生的事(除非联网)
3. 会"一本正经地胡说八道"(幻觉)
4. 没有价值观和判断力(最终决策权在你)
学 AI 最重要的能力?
└─ 不是技术,是"沟通"——会和 AI "说话"的人,AI 用得好
5 分钟动手实验
打开任何一个你能用的 AI 工具(ChatGPT、Claude、Gemini、豆包、DeepSeek、Kimi、文心一言、通义千问、智谱清言⋯⋯随便哪个),把下面这段话原样复制进去,看看会发生什么:
你好!我刚看完一本关于 AI 的书的第一章,请你做以下三件事:
1. 用一个 8 岁小朋友能听懂的比喻,解释什么是"大语言模型"。
2. 给我 3 个普通人立刻能用 AI 解决的"小事"举例(不要太常规的)。
3. 告诉我一个 AI 容易"出错"的场景,让我引以为戒。
要求:每一项不超过 100 字,分点回答。
观察重点:
- 它是否听懂了你的请求?
- 它的回答有没有"令你眼前一亮"的地方?
- 三个回答里,哪个最有启发?哪个最像"凑数的"?
把这次对话截图保存——这是你和 AI 关系的"第一张合影"。
下章预告
下一章 第二章 2026 年 AI 工具全景图,我们带你俯瞰一下 2026 年的 AI 江湖:
- 国外的"四大金刚":ChatGPT、Claude、Gemini、Grok 各自什么定位
- 国内的"六大主流":豆包、DeepSeek、Kimi、文心一言、通义千问、智谱清言怎么选
- 专业垂直工具:Midjourney、Sora、Runway、Suno⋯⋯什么时候用
- 一份"决策树":根据你的需求和预算,告诉你该选哪一个
读完第二章,你就再也不会"AI 那么多,不知道用哪个"。