第 1 周 · 搜索的本质——从 Google 到 AI
同一个问题,不同的体验
上节课你在 Google 搜索"best noise cancelling headphones 2026",得到一页蓝色链接。
现在试试在 ChatGPT 或 Perplexity 里问同样的问题。
你会发现体验完全不同:
- 没有 10 个蓝色链接——而是一段直接的文字回答
- AI 帮你做了综合——它读了多个来源,总结出一个答案
- 可能附带引用——标注了信息来自哪些网页
- 你可以追问——“这个耳机适合跑步吗?”
这就是 AI 搜索。它不给你一堆链接让你自己翻,而是直接告诉你答案。
这个区别乍看是"用户体验"的变化,但对内容创作者来说,它意味着游戏规则的根本改变:从争夺排名,变成争夺引用。
AI 搜索的四步工作流(RAG 管线)
AI 搜索产品(ChatGPT Search、Perplexity、Google AI Overviews)使用一种叫 RAG(Retrieval-Augmented Generation,检索增强生成) 的技术。
简单来说,四步:
第一步:理解你的问题(Query Understanding)
传统搜索把你的搜索词当作"关键词"去匹配。
AI 搜索不同——它理解你的意图,甚至会把一个问题拆成多个子问题分别搜索(这叫 Query Fan-out)。
一个具体例子:
你输入:“我下周要坐 12 小时飞机,需要一个能戴着睡觉的降噪耳机,预算 2000 以内”
传统搜索看到的关键词:降噪耳机 2000
AI 搜索会把这个问题拆成:
- 2026 年最舒适的降噪耳机有哪些?(针对"能戴着睡觉")
- 哪些降噪耳机续航超过 20 小时?(针对"12 小时飞机")
- 2000 元以内的头戴式降噪耳机推荐?(针对预算限制)
- 飞机上使用降噪耳机的注意事项?(针对"飞机"这个场景)
然后 AI 分别检索这些子问题,再综合成一个完整回答。
这对 SEO/GEO 的含义:你的内容需要能回答完整的场景问题,而不只是针对某个孤立关键词。“适合飞机出行的降噪耳机"比"降噪耳机推荐"更符合 AI 搜索的检索逻辑。
第二步:检索(Retrieval)
AI 不是凭空编答案——它会实时去网上搜索(或从自己的索引里找)。
这一步和传统搜索类似,但有关键区别:
| 维度 | 传统搜索检索 | AI 搜索检索 |
|---|---|---|
| 匹配方式 | 关键词匹配为主 | 语义理解 + 关键词混合 |
| 检索单位 | 整个网页 | 网页中的段落/片段 |
| 来源数量 | 返回几百万个结果 | 只选十几个最相关的片段 |
| 时效性 | 依赖定期更新的索引 | 部分平台实时搜索 |
一个重要概念:AI 检索的不是"整个网页”,而是段落。
AI 会把网页切成 50-200 词的小块(称为"chunks"),然后用语义相似度来判断哪个小块最能回答你的问题。
这就是为什么内容结构极其重要——如果你的关键信息埋在一大段废话里,AI 提取不到。如果你的关键信息在一个清晰的短段落里,AI 一眼就能用。
实际影响:下面两种写法,AI 更容易引用哪个?
❌ 难以被 AI 引用的写法:
谈到降噪耳机,我们需要从多个维度来考虑。首先是降噪深度,这个指标非常重要,因为它决定了你在嘈杂环境下的体验。然后是舒适度,如果你长时间佩戴,舒适度会很关键。索尼 WH-1000XM6 在各方面都表现不错,它的续航也很好,可以用很长时间……
✅ 容易被 AI 引用的写法:
索尼 WH-1000XM6 是 2026 年最适合长途飞行的降噪耳机。 降噪深度达 45dB,续航 40 小时,头梁压力低于同级产品 20%,适合佩戴 8 小时以上。官方售价 ¥2,299,目前在京东有 ¥1,899 的活动价。
第二段写法里,每句话都是一个独立的可引用事实,AI 可以直接提取。
第三步:生成回答(Generation)
AI 拿到十几个相关片段后,做一件传统搜索做不到的事:综合生成一个新的回答。
它不是简单复制粘贴,而是:
- 理解每个片段说了什么
- 去除重复和矛盾信息
- 按逻辑组织成一段连贯的回答
- 用自然语言表达出来
这就像一个研究助理帮你读了 10 篇文章,然后用自己的话给你一个总结。
重要含义:AI 的回答中,你的内容可能被"融合"进去,而不是直接引用。这意味着用户看到的回答里包含你的数据或观点,但可能感知不到来源——这对品牌曝光的价值不同于传统的"点击流量",但同样真实。
第四步:引用决策(Citation Selection)
这是 GEO 最关心的一步:AI 决定在回答中标注哪些来源。
AI 不会引用它读过的所有来源——通常只引用 3-5 个。那它怎么选?
五个关键信号(第 5 周会详细展开):
| 信号 | 说明 | 量化数据(来源:KDD 2024 论文) |
|---|---|---|
| 权威性 | 网站的整体信誉和专业度 | 高权威站点被引用概率 3.5 倍 |
| 新鲜度 | 内容发布/更新时间 | 30 天内更新的内容获 3.2 倍加成 |
| 内容匹配度 | 内容和问题的精准匹配程度 | 40-60 词的精准回答段落最易被引用 |
| 结构化程度 | 是否用标题、列表、表格组织 | Schema 标记使选中率提升 73% |
| 跨平台存在感 | 品牌/信息在多个平台出现 | 4+ 平台存在感获 2.8 倍引用加成 |
传统搜索 vs AI 搜索:完整对比
| 维度 | 传统搜索(Google) | AI 搜索(ChatGPT/Perplexity) |
|---|---|---|
| 给你什么 | 一页链接,你自己选 | 一段直接回答 |
| 谁做综合 | 你自己读多个网页综合 | AI 帮你综合好了 |
| 结果数量 | 10 个蓝色链接 | 1 个回答 + 3-5 个引用 |
| 能否追问 | 不能(只能改搜索词) | 可以,多轮对话 |
| 查询方式 | 短关键词(3-5 个词) | 自然语言长句(60+ 个词) |
| 点击行为 | 需要点链接去看原文 | 很多时候不需要点击 |
| 竞争格局 | 前 10 名共享第一页 | 3-5 个引用来源,赢家通吃 |
三大 AI 平台的工作方式差异
不同 AI 搜索平台的工作机制有明显差异,这直接影响你的 GEO 策略。
ChatGPT(OpenAI)
关键特点:60% 的查询不触发网页搜索。
ChatGPT 有两种回答模式:
- 参数化知识:直接用训练数据(2024 年之前的知识)回答,不联网
- 实时搜索:当问题涉及时效性(“最新的”、“2026 年”、具体价格)时才联网
这意味着:如果你想被 ChatGPT"记住",你的品牌和内容需要足够权威,在训练数据截止前就广泛存在——不只是能被搜到,而是要被训练进模型的记忆里。
ChatGPT 偏好引用的来源:Wikipedia、权威百科、主流媒体、学术文章。
Perplexity
关键特点:每次查询都触发实时搜索。
Perplexity 是一个"永远在线"的搜索引擎:
- 自建索引超过 2000 亿 URL
- 每条回答都附带内联引用(你能看到信息来自哪里)
- 特别偏好 Reddit(引用率 6.6%,某些话题类别高达 46.7%)
- 偏好 2 个月内的新鲜内容
爬取和引用的比例:111:1(即爬取了 111 个页面,引用 1 个)——这个比例在所有 AI 爬虫中是最"公平"的。
GEO 含义:Perplexity 是最容易快速验证 GEO 效果的平台。因为它每次都搜索 + 每次都给引用,你优化后可以马上去测试。
Google AI Overviews
关键特点:叠加在传统搜索之上,不是替代品。
AI Overviews 在传统搜索结果顶部显示。它的特殊性:
- 2026 年 4 月约 25% 的美国搜索触发 AI Overview
- 信息类和 how-to 类查询覆盖率超过 70%
- 引用来源分布最广——Reddit、YouTube、LinkedIn 都有
- 如果你在 Google 传统搜索里排名靠前,被 AI Overviews 引用的概率也更高
AI 搜索的爬虫——另一群"读者"
传统搜索有 Googlebot,AI 搜索也有自己的爬虫:
| 爬虫名称 | 所属平台 | 干什么 |
|---|---|---|
| GPTBot | OpenAI(ChatGPT) | 为 ChatGPT 抓取训练数据和搜索内容 |
| OAI-SearchBot | OpenAI | 专门为 ChatGPT Search 做实时搜索 |
| PerplexityBot | Perplexity | 为 Perplexity 的答案引擎建索引 |
| ClaudeBot | Anthropic(Claude) | 为 Claude 获取内容 |
| Google-Extended | 为 Gemini(Google 的 AI)获取内容 |
这意味着什么?
你的网站现在不只被 Googlebot 一个爬虫访问了——还有一群 AI 爬虫也在读你的内容。
如果你在 robots.txt 里屏蔽了这些 AI 爬虫,你的内容就不会被 AI 搜索引用。如果你允许它们访问,你的内容就有机会出现在 AI 的回答中。
这是 GEO 的技术基础之一——第 5 周会详细讲怎么配置 robots.txt 和 llms.txt。
用户行为的真实变化
这些数字很重要,它们说明 AI 搜索已经不是"未来",而是"现在":
- 8.91 亿:ChatGPT 的月活用户(2025 年数据)
- 13 分 09 秒:ChatGPT 的平均会话时长(Google 是 6 分 12 秒)
- 35%:Z 世代将 AI 聊天机器人作为首选搜索工具的比例
- 58%:美国 30 岁以下成年人每天使用 ChatGPT 的比例
- 17.6%:ChatGPT 占全球数字查询的比例
这不是说 Google 要消亡——Google 仍有 42 亿以上用户,仍是主导。但 AI 搜索正在争夺高价值、高意图的查询——正是那些最容易转化为实际行动的搜索。
一个简单测试:去感受一下差异
在继续学习之前,做这个 5 分钟的体验:
步骤:用同一个问题,分别在三个地方搜索
搜索词(中文):2026年最值得买的降噪耳机是哪款
- Google:看到什么?广告几条?有没有 AI Overview?自然结果是什么类型?
- ChatGPT(chat.openai.com):AI 直接给出了什么答案?有没有引用来源?
- Perplexity(perplexity.ai):引用了哪些来源?各来源在回答里扮演什么角色?
注意感受:
- 你信任哪个平台的答案更多?
- 哪个平台的答案更容易让你直接采取行动?
- 如果你是耳机品牌,你更想出现在哪里?
这个问题没有标准答案——但你的直觉感受,就是理解 GEO 价值的起点。
本课小结
- AI 搜索用 RAG 技术:理解问题 → 检索片段 → 生成回答 → 标注引用
- AI 会把一个问题拆成多个子问题分别检索(Query Fan-out)——内容要覆盖完整场景
- AI 检索的是网页中的段落片段——清晰简短的段落比长篇大论更容易被引用
- 三大平台工作方式不同:ChatGPT 60% 不联网,Perplexity 每次都联网,Google AI Overviews 叠加在传统搜索上
- 不同 AI 爬虫需要在
robots.txt中明确允许——这是 GEO 的技术基础 - AI 搜索已经是"现在":ChatGPT 8.91 亿月活,35% 的 Z 世代首选 AI 搜索
下一课我们讲:SEO 和 GEO 到底是什么关系——它们是竞争、替代,还是互补?