第 1 周 · 搜索的本质——从 Google 到 AI

同一个问题，不同的体验

上节课你在 Google 搜索"best noise cancelling headphones 2026"，得到一页蓝色链接。

现在试试在 ChatGPT 或 Perplexity 里问同样的问题。

你会发现体验完全不同：

没有 10 个蓝色链接——而是一段直接的文字回答
AI 帮你做了综合——它读了多个来源，总结出一个答案
可能附带引用——标注了信息来自哪些网页
你可以追问——“这个耳机适合跑步吗？”

这就是 AI 搜索。它不给你一堆链接让你自己翻，而是直接告诉你答案。

这个区别乍看是"用户体验"的变化，但对内容创作者来说，它意味着游戏规则的根本改变：从争夺排名，变成争夺引用。

AI 搜索的四步工作流（RAG 管线）

AI 搜索产品（ChatGPT Search、Perplexity、Google AI Overviews）使用一种叫 RAG（Retrieval-Augmented Generation，检索增强生成） 的技术。

简单来说，四步：

第一步：理解你的问题（Query Understanding）

传统搜索把你的搜索词当作"关键词"去匹配。

AI 搜索不同——它理解你的意图，甚至会把一个问题拆成多个子问题分别搜索（这叫 Query Fan-out）。

一个具体例子：

你输入：“我下周要坐 12 小时飞机，需要一个能戴着睡觉的降噪耳机，预算 2000 以内”

传统搜索看到的关键词：降噪耳机 2000

AI 搜索会把这个问题拆成：

2026 年最舒适的降噪耳机有哪些？（针对"能戴着睡觉"）
哪些降噪耳机续航超过 20 小时？（针对"12 小时飞机"）
2000 元以内的头戴式降噪耳机推荐？（针对预算限制）
飞机上使用降噪耳机的注意事项？（针对"飞机"这个场景）

然后 AI 分别检索这些子问题，再综合成一个完整回答。

这对 SEO/GEO 的含义：你的内容需要能回答完整的场景问题，而不只是针对某个孤立关键词。“适合飞机出行的降噪耳机"比"降噪耳机推荐"更符合 AI 搜索的检索逻辑。

第二步：检索（Retrieval）

AI 不是凭空编答案——它会实时去网上搜索（或从自己的索引里找）。

这一步和传统搜索类似，但有关键区别：

维度	传统搜索检索	AI 搜索检索
匹配方式	关键词匹配为主	语义理解 + 关键词混合
检索单位	整个网页	网页中的段落/片段
来源数量	返回几百万个结果	只选十几个最相关的片段
时效性	依赖定期更新的索引	部分平台实时搜索

一个重要概念：AI 检索的不是"整个网页”，而是段落。

AI 会把网页切成 50-200 词的小块（称为"chunks"），然后用语义相似度来判断哪个小块最能回答你的问题。

这就是为什么内容结构极其重要——如果你的关键信息埋在一大段废话里，AI 提取不到。如果你的关键信息在一个清晰的短段落里，AI 一眼就能用。

实际影响：下面两种写法，AI 更容易引用哪个？

❌ 难以被 AI 引用的写法：

谈到降噪耳机，我们需要从多个维度来考虑。首先是降噪深度，这个指标非常重要，因为它决定了你在嘈杂环境下的体验。然后是舒适度，如果你长时间佩戴，舒适度会很关键。索尼 WH-1000XM6 在各方面都表现不错，它的续航也很好，可以用很长时间……

✅ 容易被 AI 引用的写法：

索尼 WH-1000XM6 是 2026 年最适合长途飞行的降噪耳机。 降噪深度达 45dB，续航 40 小时，头梁压力低于同级产品 20%，适合佩戴 8 小时以上。官方售价 ¥2,299，目前在京东有 ¥1,899 的活动价。

第二段写法里，每句话都是一个独立的可引用事实，AI 可以直接提取。

第三步：生成回答（Generation）

AI 拿到十几个相关片段后，做一件传统搜索做不到的事：综合生成一个新的回答。

它不是简单复制粘贴，而是：

理解每个片段说了什么
去除重复和矛盾信息
按逻辑组织成一段连贯的回答
用自然语言表达出来

这就像一个研究助理帮你读了 10 篇文章，然后用自己的话给你一个总结。

重要含义：AI 的回答中，你的内容可能被"融合"进去，而不是直接引用。这意味着用户看到的回答里包含你的数据或观点，但可能感知不到来源——这对品牌曝光的价值不同于传统的"点击流量"，但同样真实。

第四步：引用决策（Citation Selection）

这是 GEO 最关心的一步：AI 决定在回答中标注哪些来源。

AI 不会引用它读过的所有来源——通常只引用 3-5 个。那它怎么选？

五个关键信号（第 5 周会详细展开）：

信号	说明	量化数据（来源：KDD 2024 论文）
权威性	网站的整体信誉和专业度	高权威站点被引用概率 3.5 倍
新鲜度	内容发布/更新时间	30 天内更新的内容获 3.2 倍加成
内容匹配度	内容和问题的精准匹配程度	40-60 词的精准回答段落最易被引用
结构化程度	是否用标题、列表、表格组织	Schema 标记使选中率提升 73%
跨平台存在感	品牌/信息在多个平台出现	4+ 平台存在感获 2.8 倍引用加成

传统搜索 vs AI 搜索：完整对比

维度	传统搜索（Google）	AI 搜索（ChatGPT/Perplexity）
给你什么	一页链接，你自己选	一段直接回答
谁做综合	你自己读多个网页综合	AI 帮你综合好了
结果数量	10 个蓝色链接	1 个回答 + 3-5 个引用
能否追问	不能（只能改搜索词）	可以，多轮对话
查询方式	短关键词（3-5 个词）	自然语言长句（60+ 个词）
点击行为	需要点链接去看原文	很多时候不需要点击
竞争格局	前 10 名共享第一页	3-5 个引用来源，赢家通吃

三大 AI 平台的工作方式差异

不同 AI 搜索平台的工作机制有明显差异，这直接影响你的 GEO 策略。

ChatGPT（OpenAI）

关键特点：60% 的查询不触发网页搜索。

ChatGPT 有两种回答模式：

参数化知识：直接用训练数据（2024 年之前的知识）回答，不联网
实时搜索：当问题涉及时效性（“最新的”、“2026 年”、具体价格）时才联网

这意味着：如果你想被 ChatGPT"记住"，你的品牌和内容需要足够权威，在训练数据截止前就广泛存在——不只是能被搜到，而是要被训练进模型的记忆里。

ChatGPT 偏好引用的来源：Wikipedia、权威百科、主流媒体、学术文章。

Perplexity

关键特点：每次查询都触发实时搜索。

Perplexity 是一个"永远在线"的搜索引擎：

自建索引超过 2000 亿 URL
每条回答都附带内联引用（你能看到信息来自哪里）
特别偏好 Reddit（引用率 6.6%，某些话题类别高达 46.7%）
偏好 2 个月内的新鲜内容

爬取和引用的比例：111:1（即爬取了 111 个页面，引用 1 个）——这个比例在所有 AI 爬虫中是最"公平"的。

GEO 含义：Perplexity 是最容易快速验证 GEO 效果的平台。因为它每次都搜索 + 每次都给引用，你优化后可以马上去测试。

Google AI Overviews

关键特点：叠加在传统搜索之上，不是替代品。

AI Overviews 在传统搜索结果顶部显示。它的特殊性：

2026 年 4 月约 25% 的美国搜索触发 AI Overview
信息类和 how-to 类查询覆盖率超过 70%
引用来源分布最广——Reddit、YouTube、LinkedIn 都有
如果你在 Google 传统搜索里排名靠前，被 AI Overviews 引用的概率也更高

AI 搜索的爬虫——另一群"读者"

传统搜索有 Googlebot，AI 搜索也有自己的爬虫：

爬虫名称	所属平台	干什么
GPTBot	OpenAI（ChatGPT）	为 ChatGPT 抓取训练数据和搜索内容
OAI-SearchBot	OpenAI	专门为 ChatGPT Search 做实时搜索
PerplexityBot	Perplexity	为 Perplexity 的答案引擎建索引
ClaudeBot	Anthropic（Claude）	为 Claude 获取内容
Google-Extended	Google	为 Gemini（Google 的 AI）获取内容

这意味着什么？

你的网站现在不只被 Googlebot 一个爬虫访问了——还有一群 AI 爬虫也在读你的内容。

如果你在 robots.txt 里屏蔽了这些 AI 爬虫，你的内容就不会被 AI 搜索引用。如果你允许它们访问，你的内容就有机会出现在 AI 的回答中。

这是 GEO 的技术基础之一——第 5 周会详细讲怎么配置 robots.txt 和 llms.txt。

用户行为的真实变化

这些数字很重要，它们说明 AI 搜索已经不是"未来"，而是"现在"：

8.91 亿：ChatGPT 的月活用户（2025 年数据）
13 分 09 秒：ChatGPT 的平均会话时长（Google 是 6 分 12 秒）
35%：Z 世代将 AI 聊天机器人作为首选搜索工具的比例
58%：美国 30 岁以下成年人每天使用 ChatGPT 的比例
17.6%：ChatGPT 占全球数字查询的比例

这不是说 Google 要消亡——Google 仍有 42 亿以上用户，仍是主导。但 AI 搜索正在争夺高价值、高意图的查询——正是那些最容易转化为实际行动的搜索。

一个简单测试：去感受一下差异

在继续学习之前，做这个 5 分钟的体验：

步骤：用同一个问题，分别在三个地方搜索

搜索词（中文）：2026年最值得买的降噪耳机是哪款

Google：看到什么？广告几条？有没有 AI Overview？自然结果是什么类型？
ChatGPT（chat.openai.com）：AI 直接给出了什么答案？有没有引用来源？
Perplexity（perplexity.ai）：引用了哪些来源？各来源在回答里扮演什么角色？

注意感受：

你信任哪个平台的答案更多？
哪个平台的答案更容易让你直接采取行动？
如果你是耳机品牌，你更想出现在哪里？

这个问题没有标准答案——但你的直觉感受，就是理解 GEO 价值的起点。

本课小结

AI 搜索用 RAG 技术：理解问题 → 检索片段 → 生成回答 → 标注引用
AI 会把一个问题拆成多个子问题分别检索（Query Fan-out）——内容要覆盖完整场景
AI 检索的是网页中的段落片段——清晰简短的段落比长篇大论更容易被引用
三大平台工作方式不同：ChatGPT 60% 不联网，Perplexity 每次都联网，Google AI Overviews 叠加在传统搜索上
不同 AI 爬虫需要在 robots.txt 中明确允许——这是 GEO 的技术基础
AI 搜索已经是"现在"：ChatGPT 8.91 亿月活，35% 的 Z 世代首选 AI 搜索

下一课我们讲：SEO 和 GEO 到底是什么关系——它们是竞争、替代，还是互补？

同一个问题，不同的体验#

AI 搜索的四步工作流（RAG 管线）#

第一步：理解你的问题（Query Understanding）#

第二步：检索（Retrieval）#

第三步：生成回答（Generation）#

第四步：引用决策（Citation Selection）#

传统搜索 vs AI 搜索：完整对比#

三大 AI 平台的工作方式差异#

ChatGPT（OpenAI）#

Perplexity#

Google AI Overviews#

AI 搜索的爬虫——另一群"读者"#

用户行为的真实变化#

一个简单测试：去感受一下差异#

本课小结#