上一课结束时你看到了什么

如果你做完上一课的 6 次自我搜索,你应该看到了一件让人困惑的事:

  • 豆包说"没听过这个品牌"
  • DeepSeek 给了一段相对准确的描述但没标来源
  • 文心给了一段描述并指向某篇百家号文章
  • 元宝给了 3 条公众号链接
  • 千问只字未提
  • Kimi 拼凑了一段似是而非的信息

这不是运气,是结构。 每家中文 AI 都从不同的信源池里检索答案,你存在于哪个信源池,决定了哪家 AI 能引用你。

这一课讲清楚 6 个信源池各自包含什么、为什么会形成这种格局、你下一步该往哪个生态发布内容。


信源池是什么

先把这个核心术语定义清楚。

信源池(source pool):AI 在生成回答时,实际调用并引用的网页 / 平台 / 账号集合。AI 收到一个用户问题,先在自己的信源池里检索相关页面,再综合写一段回答。

英文世界的信源池有一个关键特征:ChatGPT、Perplexity、Gemini 之间共享大量稳定信源,以 Wikipedia + Reddit + 主流英文媒体为骨架。一篇内容进入 Wikipedia,几乎所有英文 AI 都会读到。

中文世界没有这种共享信源

  • 豆包优先调用字节自家平台的内容(抖音 / 头条 / 抖音百科)
  • 文心优先调用百度自家平台的内容(百家号 / 百度百科 / 百度知道)
  • 元宝优先调用微信生态的内容(公众号 / 视频号)
  • DeepSeek 不绑定任何大厂生态,从公开网络抓
  • 千问和 Kimi 各有各的策略

意味着同一篇内容必须分别发布到不同生态平台才能被不同 AI 引用。一篇内容覆盖 6 家 AI,工作量是 6 倍,而不是 1 倍。

关键概念:中文 AI 没有通用准入 英文世界进入 Wikipedia + Reddit + 主流媒体,能在多数英文 AI 里有存在感。中文世界没有这种"一招通吃":豆包绑定字节、文心绑定百度、元宝绑定微信,三家大厂自家生态之间几乎不互通。这是中文 GEO 必须分平台做的根本原因。

6 大中文 AI 的信源构成对照

下面这张图把 6 家 AI 的"主源 / 次源 / 不抓"都列出来。看完之后你会知道,把内容发到哪个平台,能被哪家 AI 引用。

6 大中文 AI 信源生态对照
豆包(字节)
主源:今日头条(声称 60%+)+ 抖音(视频转写 / 评论)+ 抖音百科(快懂百科)+ 西瓜视频。次源:知乎专业问答(约 20%)。
不抓:公众号 / 百度系 / 淘宝。视频内容引用率最高。
DeepSeek
主源:CSDN 技术博客 + 搜狐号 / 网易号 + 百科站点(百度百科 / 维基中文 / 抖音百科)+ GitHub。次源:知乎技术问答。
无生态绑定:靠通用 / 公开网络。技术 query 引用率最高。
文心一言(百度)
主源:百家号(核心)+ 百度百科 + 百度知道 + 百度健康 / 百度医典(YMYL)。次源:百度文库(仅文库 AI 入口)+ 第三方权威媒体。
不抓:抖音 / 公众号 / 知乎深度文章。强依赖百度索引基本盘。
通义千问(阿里)
主源:网易号 / 搜狐号(声称 60%+)+ 学术站 + 企业白皮书。次源:第三方博客 / 社区。电商场景额外调用淘宝商品数据。
自家电商内容在对话场景占比未明:千问是'大厂 AI 必偏好自家'的反例。
腾讯元宝
主源:微信公众号(36 亿篇历史池,最强加权)+ 视频号字幕 / 描述。次源:腾讯文档 + 通用 web。多模型路由(混元 / DeepSeek R1)。
微信内嵌 AI 搜是封闭生态:其他 AI 抓不到公众号。
Kimi(月之暗面)
主源:通用网页爬取(无大厂生态绑定)。次源:长文档场景特殊优化(PDF / 学术)。
生态绑定最弱:更接近'传统搜索 + LLM 改写',靠通用 SEO 信号。
数据可信度提醒 上面所有"60%+""核心""高"这类描述都来自第三方 GEO 服务商分析(CSDN 博客 / 自媒体 / 服务商榜单),没有官方文档背书,也没有大规模独立复现。把它们当作"相对方向"而不是"精确指标":你不该用这些数字作精细预算,但完全可以用它们决定"先发哪个生态"。

为什么会形成这种格局:3 个大厂自家生态 + 3 个不绑定大厂的 AI

把 6 家 AI 摊到一张图上,你会看到中文互联网只有三个独立的大厂自家生态(字节、腾讯、百度),以及不绑定任何大厂生态的另外 3 家 AI(DeepSeek / Kimi / 千问对话场景)。

6 大中文 AI 信源构成与跨平台爬虫封锁 6 大中文 AI:3 个大厂自家生态 + 3 个不绑定大厂的 AI 虚线 = 跨平台爬虫互不抓取 字节生态 今日头条 · 抖音 抖音百科 · 西瓜视频 豆包 字节自家 AI 视频转写优势 不抓百度 / 微信 腾讯生态 微信公众号(36 亿池) 视频号 · 腾讯文档 元宝 腾讯自家 AI 微信内嵌 AI 完全封闭 外部 AI 抓不到公众号 百度生态 百家号 · 百度百科 百度知道 · 百度健康 文心一言 百度自家 AI YMYL 类强加权 不抓抖音 / 公众号 不绑定大厂生态的 AI DeepSeek CSDN · 搜狐号 / 网易号 知乎技术 · GitHub 技术 query 引用强 无大厂内容池 Kimi 通用网页爬取 长文档 / PDF / 学术 最接近"传统搜索" 靠通用 SEO 信号 通义千问 网易号 / 搜狐号 60%+ 电商场景 → 淘宝商品 "大厂偏好自家"反例 对话/电商两套逻辑 3 家大厂自家生态各自封闭 · 3 家不绑定大厂的 AI 各走各路

为什么会形成这种格局?三个相互交织的原因:

原因 1:大厂训练数据天然倾向自家生态

字节家有抖音 + 头条这种百亿规模内容池,腾讯家有公众号 36 亿篇历史文章,百度家有百家号 + 百科 + 知道,这些内容对自家训练成本最低、合规可控、API 调用免费。让自家 AI 优先用自家内容,是商业上最优解。

原因 2:跨平台爬虫互相封锁

公众号的 robots.txt 默认屏蔽搜索引擎爬虫;抖音 / 头条对外部爬虫严格限制;百度索引也不开放给字节 / 腾讯。这种封锁是结构性的:不是"想抓抓不到",是各家平台主动设置规则不让对方抓。

原因 3:没有"中文 Wikipedia"作通用准入

英文世界 Wikipedia 是 ChatGPT 47.9% 的引用源、Gemini 直接读 Wikidata 知识图谱,它扮演了"所有 AI 都信任的公共信源"角色。中文 Wikipedia 在国内访问困难、编辑活跃度有限,没有任何一个中文百科产品获得了类似的"跨平台信任地位":百度百科只对文心有强加权,抖音百科只对豆包有强加权。

意味着你写的同一篇内容,要进入不同 AI 的视野,必须分别发布到不同生态平台。这就是这一课最重要的实操结论:发布策略路由


现在动手做一次"信源反推"

动手 5 分钟 不要等理论讲完,拿你最熟的那家中文 AI(豆包或元宝最常见)做一次反推练习,5 分钟就够。

步骤

  1. 打开你品牌识别度最高的那家 AI
  2. 输入一个你期望被引用的问题,例如:“X 行业的工具有哪些"或"如何选择 X”,把 X 换成你的领域
  3. 仔细看 AI 给的答案里,它引用的网站 / 平台 / 账号都是什么类型
  4. 对照上面那张图,AI 引用的源落在哪个生态?

3 种典型结果

  • AI 引用的全是你预期之外的源(比如你以为应该被知乎引用,结果都是头条号)→ 你应该把内容也铺到那个生态去
  • AI 引用的源和你已发布的位置匹配(比如你发了百家号,文心引用了百家号)→ 继续在这个生态深耕
  • AI 引用的源很零散(每个 query 引的都不一样)→ 这家 AI 在你的领域信源不稳定,可能要等一段时间或换一家测

把这次反推的结果记下来,下面的"发布策略路由"会用得到。


发布策略路由表:你要被谁引用,就发哪里

把上面那张图反过来看,就是这张表:你目标的 AI 决定你该发的平台。

目标 AI 优先发布渠道 次优渠道 备注
豆包 今日头条 + 抖音视频(含完整字幕) 西瓜视频 + 抖音百科 / 快懂百科条目 视频转写信号最强;公众号几乎无效
DeepSeek CSDN 技术博客 + 搜狐号 / 网易号 知乎技术专栏 + GitHub README 技术领域优先;无生态依赖
文心 百家号(核心) + 百度百科 / 百度知道 百度健康(医疗类) + 行业权威媒体 强依赖百度索引——做百度 SEO 同步受益
千问 网易号 / 搜狐号 学术站 / 企业白皮书 电商类需走淘宝商品页(另起策略)
元宝 微信公众号 + 视频号字幕描述 腾讯文档(B 端) + 知乎 微信内嵌 AI 搜是封闭场——只有公众号 + 视频号能进
Kimi 高质量独立网站(被通用爬虫稳定抓取) 学术 PDF / 长文档 没有"专门为 Kimi 优化"的生态——做通用 SEO 即可

怎么用这张表

  1. 从 AI 倒推:你最在意被哪家引用?对照表找出对应的优先渠道。
  2. 从渠道正推:你已经在某个平台有内容积累?看它能影响哪几家 AI。
  3. 不要平均分配:6 家全做、每家做一点,比集中做 2 家差很多。生态优势是边际递增的,写第 10 篇头条号的边际收益远大于写 2 篇公众号 + 2 篇知乎 + 2 篇 CSDN 拼凑覆盖。

下一课会按"主体类型"(中小品牌 / 大品牌 / 出海 / B2B / 本地服务)告诉你具体先做哪一个生态。这一课先让你看到全图。


中文 AI 信源识别 3 个常见误区

注意 这 3 个误区每一个都来自被服务商话术误导的真实学员。在你做任何 GEO 投入之前,先用上面那张图对照,确认你不在掉坑里。

误区 1:以为"全网铺设"就能覆盖所有 AI

很多团队的策略是"内容铺到所有平台",公众号、知乎、小红书、头条、百家号、CSDN 各发一篇相同内容。看起来很全,实际效果接近于在每个生态都只投了 1 篇。每个生态都需要持续更新 + 有一定深度才能被 AI 视为"权威源",单次铺设的引用价值极低

误区 2:以为公众号是中文最大内容池所以覆盖率最高

公众号确实是中文最大内容池(36 亿篇),但它只对元宝有显著价值:豆包、文心、千问、DeepSeek、Kimi 抓公众号的比例显著偏低。原因:公众号 robots.txt 封锁通用爬虫 + 大厂之间互不开放。这是"内容量大 ≠ 引用面广"的典型反直觉案例。

误区 3:以为做百度 SEO 就能让所有中文 AI 引用

百度索引是文心的核心信源(强相关),但不是其他中文 AI 的输入。豆包用字节自家索引,元宝用腾讯自家索引 + 通用 web,DeepSeek 用通用网络爬虫,它们都不直接读百度索引。这和英文世界(ChatGPT / Bing Copilot 都用 Bing 索引)的根本差别。


反话术:服务商常说什么,你应该警惕什么

反话术 #1:公众号矩阵覆盖所有中文 AI
判定:❌ 大概率不成立。
公众号在元宝 / 微信搜一搜里确实是核心信源,但豆包优先抓字节系内容、文心优先抓百度系内容、千问优先抓网易号 / 搜狐号、DeepSeek 优先抓 CSDN / 知乎,它们抓公众号的比例显著偏低。如果服务商承诺"做 N 个公众号 = 覆盖所有中文 AI",警惕,这是把"在元宝有效"过度泛化成"在所有 AI 有效"。
反话术 #2:知乎权威账号 = 中文 AI 通用准入
判定:❌ 仅在部分 AI 部分品类成立。
知乎在 DeepSeek(技术类 query)+ 豆包(专业问答外部信源约 20%)里有一定权重,但不是所有中文 AI 都把知乎当"权威信源":文心几乎不引用知乎深度文章(百度生态封闭)、元宝引用知乎的比例显著低于公众号、千问偏好搜狐号 / 网易号而非知乎。如果服务商承诺"知乎账号矩阵 = 多 AI 覆盖",要让他列出"哪几家 AI、哪类 query、引用率多少",拿不出口径就是话术。

关键术语表

术语 解释 这一课怎么用
信源池 / Source Pool AI 生成回答时调用并引用的网页 / 平台 / 账号集合 中文 AI 各家信源池几乎不重合
生态绑定 大厂自家 AI 优先调用自家内容池 豆包→字节、文心→百度、元宝→腾讯
跨平台爬虫封锁 一个平台的内容被另一个平台爬虫读不到 公众号封百度、抖音封百度等
通用准入 一个信源被多家 AI 共同信任 英文有 Wikipedia,中文没有对等物
YMYL Your Money or Your Life,关乎健康 / 金融的 query 文心对这类 query 强加权官方机构
多模型路由 一个 AI 产品根据 query 类型调用不同底层模型 元宝在复杂推理时切到 DeepSeek R1

本课小结

  1. 信源池 = AI 生成回答时实际调用的网页 / 平台 / 账号集合:中文 AI 各家信源池几乎不重合,没有"通用准入"
  2. 3 个大厂自家生态:字节(豆包)、腾讯(元宝)、百度(文心)各自封闭,互不抓取
  3. 3 个不绑定大厂的 AI:DeepSeek(CSDN / 知乎 / 网易)、Kimi(通用 SEO 信号)、千问对话场景(网易号 / 搜狐号 / 不偏好自家电商内容)
  4. 同一篇内容必须分别发布到不同生态平台:一稿多投不等于一稿多发,每个生态需要单独深耕
  5. 目标 AI 决定优先渠道:豆包→头条 / 抖音、文心→百家号、元宝→公众号、DeepSeek→CSDN / 知乎
  6. 不要相信"一个矩阵覆盖所有 AI":公众号矩阵、知乎矩阵都是部分有效,要按生态分别评估
  7. 数据可信度低:所有"X 占比 60%“来自服务商口径,没有大规模独立复现,把它当方向不当精确指标

完成本课的下一步

立即去做(30 分钟)
做完上面的"信源反推"练习后,结合你的业务类型 + 现有内容资产,列出一份你自己的"发布优先级 1-3 表":你接下来 3 个月最该深耕的 1 个生态、其次 1 个、可以缓的 1 个。

这份优先级表会贯穿整个中文互联网篇,下一课讲"主体类型决策"时会用到,§5「平台对照」时也会回头对照。

下一课预告:第 3 课「主体合规:蓝 V / 黄 V / L3 等级到底有没有用」。把 GEO 服务商最常推销的"账号等级套餐"拆开看,分清"主体合规”(必须做)和"等级数字"(多数情况下无效)。

中文互联网篇 2/13 完成。如果你做了这一课的反推练习 + 列出了发布优先级表,你已经开始按生态分别投入,而不是把同一篇内容往所有平台铺。这是中文 GEO 最重要的策略调整。

← 返回中文互联网篇目录