第 1 周 · 搜索的本质——从 Google 到 AI


同一个问题,不同的体验

上节课你在 Google 搜索"best noise cancelling headphones 2026",得到一页蓝色链接。

现在试试在 ChatGPTPerplexity 里问同样的问题。

你会发现体验完全不同:

  • 没有 10 个蓝色链接——而是一段直接的文字回答
  • AI 帮你做了综合——它读了多个来源,总结出一个答案
  • 可能附带引用——标注了信息来自哪些网页
  • 你可以追问——“这个耳机适合跑步吗?”

这就是 AI 搜索。它不给你一堆链接让你自己翻,而是直接告诉你答案。

这个区别乍看是"用户体验"的变化,但对内容创作者来说,它意味着游戏规则的根本改变:从争夺排名,变成争夺引用。


AI 搜索的四步工作流(RAG 管线)

AI 搜索产品(ChatGPT Search、Perplexity、Google AI Overviews)使用一种叫 RAG(Retrieval-Augmented Generation,检索增强生成) 的技术。

简单来说,四步:

第一步:理解你的问题(Query Understanding)

传统搜索把你的搜索词当作"关键词"去匹配。

AI 搜索不同——它理解你的意图,甚至会把一个问题拆成多个子问题分别搜索(这叫 Query Fan-out)。

一个具体例子

你输入:“我下周要坐 12 小时飞机,需要一个能戴着睡觉的降噪耳机,预算 2000 以内”

传统搜索看到的关键词:降噪耳机 2000

AI 搜索会把这个问题拆成:

  1. 2026 年最舒适的降噪耳机有哪些?(针对"能戴着睡觉")
  2. 哪些降噪耳机续航超过 20 小时?(针对"12 小时飞机")
  3. 2000 元以内的头戴式降噪耳机推荐?(针对预算限制)
  4. 飞机上使用降噪耳机的注意事项?(针对"飞机"这个场景)

然后 AI 分别检索这些子问题,再综合成一个完整回答。

这对 SEO/GEO 的含义:你的内容需要能回答完整的场景问题,而不只是针对某个孤立关键词。“适合飞机出行的降噪耳机"比"降噪耳机推荐"更符合 AI 搜索的检索逻辑。

第二步:检索(Retrieval)

AI 不是凭空编答案——它会实时去网上搜索(或从自己的索引里找)。

这一步和传统搜索类似,但有关键区别:

维度 传统搜索检索 AI 搜索检索
匹配方式 关键词匹配为主 语义理解 + 关键词混合
检索单位 整个网页 网页中的段落/片段
来源数量 返回几百万个结果 只选十几个最相关的片段
时效性 依赖定期更新的索引 部分平台实时搜索

一个重要概念:AI 检索的不是"整个网页”,而是段落。

AI 会把网页切成 50-200 词的小块(称为"chunks"),然后用语义相似度来判断哪个小块最能回答你的问题。

这就是为什么内容结构极其重要——如果你的关键信息埋在一大段废话里,AI 提取不到。如果你的关键信息在一个清晰的短段落里,AI 一眼就能用。

实际影响:下面两种写法,AI 更容易引用哪个?

难以被 AI 引用的写法

谈到降噪耳机,我们需要从多个维度来考虑。首先是降噪深度,这个指标非常重要,因为它决定了你在嘈杂环境下的体验。然后是舒适度,如果你长时间佩戴,舒适度会很关键。索尼 WH-1000XM6 在各方面都表现不错,它的续航也很好,可以用很长时间……

容易被 AI 引用的写法

索尼 WH-1000XM6 是 2026 年最适合长途飞行的降噪耳机。 降噪深度达 45dB,续航 40 小时,头梁压力低于同级产品 20%,适合佩戴 8 小时以上。官方售价 ¥2,299,目前在京东有 ¥1,899 的活动价。

第二段写法里,每句话都是一个独立的可引用事实,AI 可以直接提取。

第三步:生成回答(Generation)

AI 拿到十几个相关片段后,做一件传统搜索做不到的事:综合生成一个新的回答

它不是简单复制粘贴,而是:

  1. 理解每个片段说了什么
  2. 去除重复和矛盾信息
  3. 按逻辑组织成一段连贯的回答
  4. 用自然语言表达出来

这就像一个研究助理帮你读了 10 篇文章,然后用自己的话给你一个总结。

重要含义:AI 的回答中,你的内容可能被"融合"进去,而不是直接引用。这意味着用户看到的回答里包含你的数据或观点,但可能感知不到来源——这对品牌曝光的价值不同于传统的"点击流量",但同样真实。

第四步:引用决策(Citation Selection)

这是 GEO 最关心的一步:AI 决定在回答中标注哪些来源

AI 不会引用它读过的所有来源——通常只引用 3-5 个。那它怎么选?

五个关键信号(第 5 周会详细展开):

信号 说明 量化数据(来源:KDD 2024 论文)
权威性 网站的整体信誉和专业度 高权威站点被引用概率 3.5 倍
新鲜度 内容发布/更新时间 30 天内更新的内容获 3.2 倍加成
内容匹配度 内容和问题的精准匹配程度 40-60 词的精准回答段落最易被引用
结构化程度 是否用标题、列表、表格组织 Schema 标记使选中率提升 73%
跨平台存在感 品牌/信息在多个平台出现 4+ 平台存在感获 2.8 倍引用加成

传统搜索 vs AI 搜索:完整对比

维度 传统搜索(Google) AI 搜索(ChatGPT/Perplexity)
给你什么 一页链接,你自己选 一段直接回答
谁做综合 你自己读多个网页综合 AI 帮你综合好了
结果数量 10 个蓝色链接 1 个回答 + 3-5 个引用
能否追问 不能(只能改搜索词) 可以,多轮对话
查询方式 短关键词(3-5 个词) 自然语言长句(60+ 个词)
点击行为 需要点链接去看原文 很多时候不需要点击
竞争格局 前 10 名共享第一页 3-5 个引用来源,赢家通吃

三大 AI 平台的工作方式差异

不同 AI 搜索平台的工作机制有明显差异,这直接影响你的 GEO 策略。

ChatGPT(OpenAI)

关键特点:60% 的查询不触发网页搜索。

ChatGPT 有两种回答模式:

  • 参数化知识:直接用训练数据(2024 年之前的知识)回答,不联网
  • 实时搜索:当问题涉及时效性(“最新的”、“2026 年”、具体价格)时才联网

这意味着:如果你想被 ChatGPT"记住",你的品牌和内容需要足够权威,在训练数据截止前就广泛存在——不只是能被搜到,而是要被训练进模型的记忆里。

ChatGPT 偏好引用的来源:Wikipedia、权威百科、主流媒体、学术文章。

Perplexity

关键特点:每次查询都触发实时搜索。

Perplexity 是一个"永远在线"的搜索引擎:

  • 自建索引超过 2000 亿 URL
  • 每条回答都附带内联引用(你能看到信息来自哪里)
  • 特别偏好 Reddit(引用率 6.6%,某些话题类别高达 46.7%)
  • 偏好 2 个月内的新鲜内容

爬取和引用的比例:111:1(即爬取了 111 个页面,引用 1 个)——这个比例在所有 AI 爬虫中是最"公平"的。

GEO 含义:Perplexity 是最容易快速验证 GEO 效果的平台。因为它每次都搜索 + 每次都给引用,你优化后可以马上去测试。

Google AI Overviews

关键特点:叠加在传统搜索之上,不是替代品。

AI Overviews 在传统搜索结果顶部显示。它的特殊性:

  • 2026 年 4 月约 25% 的美国搜索触发 AI Overview
  • 信息类和 how-to 类查询覆盖率超过 70%
  • 引用来源分布最广——Reddit、YouTube、LinkedIn 都有
  • 如果你在 Google 传统搜索里排名靠前,被 AI Overviews 引用的概率也更高

AI 搜索的爬虫——另一群"读者"

传统搜索有 Googlebot,AI 搜索也有自己的爬虫:

爬虫名称 所属平台 干什么
GPTBot OpenAI(ChatGPT) 为 ChatGPT 抓取训练数据和搜索内容
OAI-SearchBot OpenAI 专门为 ChatGPT Search 做实时搜索
PerplexityBot Perplexity 为 Perplexity 的答案引擎建索引
ClaudeBot Anthropic(Claude) 为 Claude 获取内容
Google-Extended Google 为 Gemini(Google 的 AI)获取内容

这意味着什么?

你的网站现在不只被 Googlebot 一个爬虫访问了——还有一群 AI 爬虫也在读你的内容。

如果你在 robots.txt 里屏蔽了这些 AI 爬虫,你的内容就不会被 AI 搜索引用。如果你允许它们访问,你的内容就有机会出现在 AI 的回答中。

这是 GEO 的技术基础之一——第 5 周会详细讲怎么配置 robots.txtllms.txt


用户行为的真实变化

这些数字很重要,它们说明 AI 搜索已经不是"未来",而是"现在":

  • 8.91 亿:ChatGPT 的月活用户(2025 年数据)
  • 13 分 09 秒:ChatGPT 的平均会话时长(Google 是 6 分 12 秒)
  • 35%:Z 世代将 AI 聊天机器人作为首选搜索工具的比例
  • 58%:美国 30 岁以下成年人每天使用 ChatGPT 的比例
  • 17.6%:ChatGPT 占全球数字查询的比例

这不是说 Google 要消亡——Google 仍有 42 亿以上用户,仍是主导。但 AI 搜索正在争夺高价值、高意图的查询——正是那些最容易转化为实际行动的搜索。


一个简单测试:去感受一下差异

在继续学习之前,做这个 5 分钟的体验:

步骤:用同一个问题,分别在三个地方搜索

搜索词(中文):2026年最值得买的降噪耳机是哪款

  1. Google:看到什么?广告几条?有没有 AI Overview?自然结果是什么类型?
  2. ChatGPT(chat.openai.com):AI 直接给出了什么答案?有没有引用来源?
  3. Perplexity(perplexity.ai):引用了哪些来源?各来源在回答里扮演什么角色?

注意感受:

  • 你信任哪个平台的答案更多?
  • 哪个平台的答案更容易让你直接采取行动?
  • 如果你是耳机品牌,你更想出现在哪里?

这个问题没有标准答案——但你的直觉感受,就是理解 GEO 价值的起点。


本课小结

  1. AI 搜索用 RAG 技术:理解问题 → 检索片段 → 生成回答 → 标注引用
  2. AI 会把一个问题拆成多个子问题分别检索(Query Fan-out)——内容要覆盖完整场景
  3. AI 检索的是网页中的段落片段——清晰简短的段落比长篇大论更容易被引用
  4. 三大平台工作方式不同:ChatGPT 60% 不联网,Perplexity 每次都联网,Google AI Overviews 叠加在传统搜索上
  5. 不同 AI 爬虫需要在 robots.txt 中明确允许——这是 GEO 的技术基础
  6. AI 搜索已经是"现在":ChatGPT 8.91 亿月活,35% 的 Z 世代首选 AI 搜索

下一课我们讲:SEO 和 GEO 到底是什么关系——它们是竞争、替代,还是互补?