这一课用的'信源占比'数据可信度如何？

中等偏低。所有'X 平台占比 60%'这类数字都来自第三方 GEO 服务商分析（CSDN / 自媒体 / 服务商榜单），目前没有官方文档背书，也没有大规模独立复现。这一课用这些数字是为了让你看清'生态绑定'的方向，但你不应该把任何一个百分比当成精确指标——把它当成'哪个生态值得优先发'的相对参考。

6 大 AI 我都要发吗？预算有限怎么取舍？

不必都发。下一课会按'主体类型'教你怎么取舍——中小品牌通常聚焦 1-2 家 + 1 个内容生态就够；中大型品牌才需要 4 家以上覆盖。这一课先让你看到全图，下一课再讲'挑哪几家'。

千问明明是阿里的，怎么不优先抓淘宝内容？

千问的对话场景（千问 APP / 网页版）目前主要抓网易号、搜狐号等第三方资讯，自家电商内容反而占比未明。但在'淘宝 / 支付宝内嵌 AI 办事'场景下，千问会调用淘宝商品数据——这是另一种 GEO（商品调用），不是普通文章引用。讲到电商 GEO 的课会展开。

我只发公众号，能覆盖几家中文 AI？

大概率只能覆盖 1.5 家——元宝（强）+ 微信内搜一搜（强）。豆包、文心、千问、DeepSeek、Kimi 抓公众号的比例显著偏低（公众号有 robots 封锁 + 各家爬虫不进微信生态）。把'公众号矩阵覆盖所有 AI'当真，是中文 GEO 最常见的话术陷阱。

我做了 SEO 让百度收录，是不是也能让其他中文 AI 引用？

不能。百度索引→文心是直接通道（百度系内部 RAG），但豆包不抓百度索引、元宝不抓百度索引、DeepSeek 不抓百度索引——它们各有自己的检索后端。中文世界没有'通用索引层'作为所有 AI 的共同入口，这是和英文世界（Bing 索引同时给 ChatGPT / Bing Copilot 用）最根本的差别。

第 2 课：中文 LLM 信源构成对照——它们各自从哪里抓内容？

上一课结束时你看到了什么

如果你做完上一课的 6 次自我搜索，你应该看到了一件让人困惑的事：

豆包说"没听过这个品牌"
DeepSeek 给了一段相对准确的描述但没标来源
文心给了一段描述并指向某篇百家号文章
元宝给了 3 条公众号链接
千问只字未提
Kimi 拼凑了一段似是而非的信息

这不是运气，是结构。 每家中文 AI 都从不同的信源池里检索答案，你存在于哪个信源池，决定了哪家 AI 能引用你。

这一课讲清楚 6 个信源池各自包含什么、为什么会形成这种格局、你下一步该往哪个生态发布内容。

信源池是什么

先把这个核心术语定义清楚。

信源池（source pool）：AI 在生成回答时，实际调用并引用的网页 / 平台 / 账号集合。AI 收到一个用户问题，先在自己的信源池里检索相关页面，再综合写一段回答。

英文世界的信源池有一个关键特征：ChatGPT、Perplexity、Gemini 之间共享大量稳定信源，以 Wikipedia + Reddit + 主流英文媒体为骨架。一篇内容进入 Wikipedia，几乎所有英文 AI 都会读到。

中文世界没有这种共享信源：

豆包优先调用字节自家平台的内容（抖音 / 头条 / 抖音百科）
文心优先调用百度自家平台的内容（百家号 / 百度百科 / 百度知道）
元宝优先调用微信生态的内容（公众号 / 视频号）
DeepSeek 不绑定任何大厂生态，从公开网络抓
千问和 Kimi 各有各的策略

意味着同一篇内容必须分别发布到不同生态平台才能被不同 AI 引用。一篇内容覆盖 6 家 AI，工作量是 6 倍，而不是 1 倍。

关键概念：中文 AI 没有通用准入 英文世界进入 Wikipedia + Reddit + 主流媒体，能在多数英文 AI 里有存在感。中文世界没有这种"一招通吃"：豆包绑定字节、文心绑定百度、元宝绑定微信，三家大厂自家生态之间几乎不互通。这是中文 GEO 必须分平台做的根本原因。

6 大中文 AI 的信源构成对照

下面这张图把 6 家 AI 的"主源 / 次源 / 不抓"都列出来。看完之后你会知道，把内容发到哪个平台，能被哪家 AI 引用。

6 大中文 AI 信源生态对照

豆包（字节）

主源：今日头条（声称 60%+）+ 抖音（视频转写 / 评论）+ 抖音百科（快懂百科）+ 西瓜视频。次源：知乎专业问答（约 20%）。

不抓：公众号 / 百度系 / 淘宝。视频内容引用率最高。

DeepSeek

主源：CSDN 技术博客 + 搜狐号 / 网易号 + 百科站点（百度百科 / 维基中文 / 抖音百科）+ GitHub。次源：知乎技术问答。

无生态绑定：靠通用 / 公开网络。技术 query 引用率最高。

文心一言（百度）

主源：百家号（核心）+ 百度百科 + 百度知道 + 百度健康 / 百度医典（YMYL）。次源：百度文库（仅文库 AI 入口）+ 第三方权威媒体。

不抓：抖音 / 公众号 / 知乎深度文章。强依赖百度索引基本盘。

通义千问（阿里）

主源：网易号 / 搜狐号（声称 60%+）+ 学术站 + 企业白皮书。次源：第三方博客 / 社区。电商场景额外调用淘宝商品数据。

自家电商内容在对话场景占比未明：千问是'大厂 AI 必偏好自家'的反例。

腾讯元宝

主源：微信公众号（36 亿篇历史池，最强加权）+ 视频号字幕 / 描述。次源：腾讯文档 + 通用 web。多模型路由（混元 / DeepSeek R1）。

微信内嵌 AI 搜是封闭生态：其他 AI 抓不到公众号。

Kimi（月之暗面）

主源：通用网页爬取（无大厂生态绑定）。次源：长文档场景特殊优化（PDF / 学术）。

生态绑定最弱：更接近'传统搜索 + LLM 改写'，靠通用 SEO 信号。

数据可信度提醒 上面所有"60%+""核心""高"这类描述都来自第三方 GEO 服务商分析（CSDN 博客 / 自媒体 / 服务商榜单），没有官方文档背书，也没有大规模独立复现。把它们当作"相对方向"而不是"精确指标"：你不该用这些数字作精细预算，但完全可以用它们决定"先发哪个生态"。

为什么会形成这种格局：3 个大厂自家生态 + 3 个不绑定大厂的 AI

把 6 家 AI 摊到一张图上，你会看到中文互联网只有三个独立的大厂自家生态（字节、腾讯、百度），以及不绑定任何大厂生态的另外 3 家 AI（DeepSeek / Kimi / 千问对话场景）。

为什么会形成这种格局？三个相互交织的原因：

原因 1：大厂训练数据天然倾向自家生态

字节家有抖音 + 头条这种百亿规模内容池，腾讯家有公众号 36 亿篇历史文章，百度家有百家号 + 百科 + 知道，这些内容对自家训练成本最低、合规可控、API 调用免费。让自家 AI 优先用自家内容，是商业上最优解。

原因 2：跨平台爬虫互相封锁

公众号的 robots.txt 默认屏蔽搜索引擎爬虫；抖音 / 头条对外部爬虫严格限制；百度索引也不开放给字节 / 腾讯。这种封锁是结构性的：不是"想抓抓不到"，是各家平台主动设置规则不让对方抓。

原因 3：没有"中文 Wikipedia"作通用准入

英文世界 Wikipedia 是 ChatGPT 47.9% 的引用源、Gemini 直接读 Wikidata 知识图谱，它扮演了"所有 AI 都信任的公共信源"角色。中文 Wikipedia 在国内访问困难、编辑活跃度有限，没有任何一个中文百科产品获得了类似的"跨平台信任地位"：百度百科只对文心有强加权，抖音百科只对豆包有强加权。

意味着你写的同一篇内容，要进入不同 AI 的视野，必须分别发布到不同生态平台。这就是这一课最重要的实操结论：发布策略路由。

现在动手做一次"信源反推"

动手 5 分钟 不要等理论讲完，拿你最熟的那家中文 AI（豆包或元宝最常见）做一次反推练习，5 分钟就够。

步骤：

打开你品牌识别度最高的那家 AI
输入一个你期望被引用的问题，例如：“X 行业的工具有哪些"或"如何选择 X”，把 X 换成你的领域
仔细看 AI 给的答案里，它引用的网站 / 平台 / 账号都是什么类型
对照上面那张图，AI 引用的源落在哪个生态？

3 种典型结果：

AI 引用的全是你预期之外的源（比如你以为应该被知乎引用，结果都是头条号）→ 你应该把内容也铺到那个生态去
AI 引用的源和你已发布的位置匹配（比如你发了百家号，文心引用了百家号）→ 继续在这个生态深耕
AI 引用的源很零散（每个 query 引的都不一样）→ 这家 AI 在你的领域信源不稳定，可能要等一段时间或换一家测

把这次反推的结果记下来，下面的"发布策略路由"会用得到。

发布策略路由表：你要被谁引用，就发哪里

把上面那张图反过来看，就是这张表：你目标的 AI 决定你该发的平台。

目标 AI	优先发布渠道	次优渠道	备注
豆包	今日头条 + 抖音视频（含完整字幕）	西瓜视频 + 抖音百科 / 快懂百科条目	视频转写信号最强；公众号几乎无效
DeepSeek	CSDN 技术博客 + 搜狐号 / 网易号	知乎技术专栏 + GitHub README	技术领域优先；无生态依赖
文心	百家号（核心） + 百度百科 / 百度知道	百度健康（医疗类） + 行业权威媒体	强依赖百度索引——做百度 SEO 同步受益
千问	网易号 / 搜狐号	学术站 / 企业白皮书	电商类需走淘宝商品页（另起策略）
元宝	微信公众号 + 视频号字幕描述	腾讯文档（B 端） + 知乎	微信内嵌 AI 搜是封闭场——只有公众号 + 视频号能进
Kimi	高质量独立网站（被通用爬虫稳定抓取）	学术 PDF / 长文档	没有"专门为 Kimi 优化"的生态——做通用 SEO 即可

怎么用这张表：

从 AI 倒推：你最在意被哪家引用？对照表找出对应的优先渠道。
从渠道正推：你已经在某个平台有内容积累？看它能影响哪几家 AI。
不要平均分配：6 家全做、每家做一点，比集中做 2 家差很多。生态优势是边际递增的，写第 10 篇头条号的边际收益远大于写 2 篇公众号 + 2 篇知乎 + 2 篇 CSDN 拼凑覆盖。

下一课会按"主体类型"（中小品牌 / 大品牌 / 出海 / B2B / 本地服务）告诉你具体先做哪一个生态。这一课先让你看到全图。

中文 AI 信源识别 3 个常见误区

注意这 3 个误区每一个都来自被服务商话术误导的真实学员。在你做任何 GEO 投入之前，先用上面那张图对照，确认你不在掉坑里。

误区 1：以为"全网铺设"就能覆盖所有 AI

很多团队的策略是"内容铺到所有平台"，公众号、知乎、小红书、头条、百家号、CSDN 各发一篇相同内容。看起来很全，实际效果接近于在每个生态都只投了 1 篇。每个生态都需要持续更新 + 有一定深度才能被 AI 视为"权威源"，单次铺设的引用价值极低。

误区 2：以为公众号是中文最大内容池所以覆盖率最高

公众号确实是中文最大内容池（36 亿篇），但它只对元宝有显著价值：豆包、文心、千问、DeepSeek、Kimi 抓公众号的比例显著偏低。原因：公众号 robots.txt 封锁通用爬虫 + 大厂之间互不开放。这是"内容量大 ≠ 引用面广"的典型反直觉案例。

误区 3：以为做百度 SEO 就能让所有中文 AI 引用

百度索引是文心的核心信源（强相关），但不是其他中文 AI 的输入。豆包用字节自家索引，元宝用腾讯自家索引 + 通用 web，DeepSeek 用通用网络爬虫，它们都不直接读百度索引。这和英文世界（ChatGPT / Bing Copilot 都用 Bing 索引）的根本差别。

反话术：服务商常说什么，你应该警惕什么

反话术 #1：公众号矩阵覆盖所有中文 AI
判定：❌ 大概率不成立。
公众号在元宝 / 微信搜一搜里确实是核心信源，但豆包优先抓字节系内容、文心优先抓百度系内容、千问优先抓网易号 / 搜狐号、DeepSeek 优先抓 CSDN / 知乎，它们抓公众号的比例显著偏低。如果服务商承诺"做 N 个公众号 = 覆盖所有中文 AI"，警惕，这是把"在元宝有效"过度泛化成"在所有 AI 有效"。

反话术 #2：知乎权威账号 = 中文 AI 通用准入
判定：❌ 仅在部分 AI 部分品类成立。
知乎在 DeepSeek（技术类 query）+ 豆包（专业问答外部信源约 20%）里有一定权重，但不是所有中文 AI 都把知乎当"权威信源"：文心几乎不引用知乎深度文章（百度生态封闭）、元宝引用知乎的比例显著低于公众号、千问偏好搜狐号 / 网易号而非知乎。如果服务商承诺"知乎账号矩阵 = 多 AI 覆盖"，要让他列出"哪几家 AI、哪类 query、引用率多少"，拿不出口径就是话术。

关键术语表

术语	解释	这一课怎么用
信源池 / Source Pool	AI 生成回答时调用并引用的网页 / 平台 / 账号集合	中文 AI 各家信源池几乎不重合
生态绑定	大厂自家 AI 优先调用自家内容池	豆包→字节、文心→百度、元宝→腾讯
跨平台爬虫封锁	一个平台的内容被另一个平台爬虫读不到	公众号封百度、抖音封百度等
通用准入	一个信源被多家 AI 共同信任	英文有 Wikipedia，中文没有对等物
YMYL	Your Money or Your Life，关乎健康 / 金融的 query	文心对这类 query 强加权官方机构
多模型路由	一个 AI 产品根据 query 类型调用不同底层模型	元宝在复杂推理时切到 DeepSeek R1

本课小结

信源池 = AI 生成回答时实际调用的网页 / 平台 / 账号集合：中文 AI 各家信源池几乎不重合，没有"通用准入"
3 个大厂自家生态：字节（豆包）、腾讯（元宝）、百度（文心）各自封闭，互不抓取
3 个不绑定大厂的 AI：DeepSeek（CSDN / 知乎 / 网易）、Kimi（通用 SEO 信号）、千问对话场景（网易号 / 搜狐号 / 不偏好自家电商内容）
同一篇内容必须分别发布到不同生态平台：一稿多投不等于一稿多发，每个生态需要单独深耕
目标 AI 决定优先渠道：豆包→头条 / 抖音、文心→百家号、元宝→公众号、DeepSeek→CSDN / 知乎
不要相信"一个矩阵覆盖所有 AI"：公众号矩阵、知乎矩阵都是部分有效，要按生态分别评估
数据可信度低：所有"X 占比 60%“来自服务商口径，没有大规模独立复现，把它当方向不当精确指标

完成本课的下一步

立即去做（30 分钟）
做完上面的"信源反推"练习后，结合你的业务类型 + 现有内容资产，列出一份你自己的"发布优先级 1-3 表"：你接下来 3 个月最该深耕的 1 个生态、其次 1 个、可以缓的 1 个。

这份优先级表会贯穿整个中文互联网篇，下一课讲"主体类型决策"时会用到，§5「平台对照」时也会回头对照。

下一课预告：第 3 课「主体合规：蓝 V / 黄 V / L3 等级到底有没有用」。把 GEO 服务商最常推销的"账号等级套餐"拆开看，分清"主体合规”（必须做）和"等级数字"（多数情况下无效）。

中文互联网篇 2/13 完成。如果你做了这一课的反推练习 + 列出了发布优先级表，你已经开始按生态分别投入，而不是把同一篇内容往所有平台铺。这是中文 GEO 最重要的策略调整。

← 返回中文互联网篇目录

上一课结束时你看到了什么#

信源池是什么#

6 大中文 AI 的信源构成对照#

为什么会形成这种格局：3 个大厂自家生态 + 3 个不绑定大厂的 AI#

现在动手做一次"信源反推"#

发布策略路由表：你要被谁引用，就发哪里#

中文 AI 信源识别 3 个常见误区#

反话术：服务商常说什么，你应该警惕什么#

关键术语表#

本课小结#

完成本课的下一步#

上一课结束时你看到了什么

信源池是什么

6 大中文 AI 的信源构成对照

为什么会形成这种格局：3 个大厂自家生态 + 3 个不绑定大厂的 AI

现在动手做一次"信源反推"

发布策略路由表：你要被谁引用，就发哪里

中文 AI 信源识别 3 个常见误区

反话术：服务商常说什么，你应该警惕什么

关键术语表

本课小结

完成本课的下一步