上一课结束时你看到了什么
如果你做完上一课的 6 次自我搜索,你应该看到了一件让人困惑的事:
- 豆包说"没听过这个品牌"
- DeepSeek 给了一段相对准确的描述但没标来源
- 文心给了一段描述并指向某篇百家号文章
- 元宝给了 3 条公众号链接
- 千问只字未提
- Kimi 拼凑了一段似是而非的信息
这不是运气,是结构。 每家中文 AI 都从不同的信源池里检索答案,你存在于哪个信源池,决定了哪家 AI 能引用你。
这一课讲清楚 6 个信源池各自包含什么、为什么会形成这种格局、你下一步该往哪个生态发布内容。
信源池是什么
先把这个核心术语定义清楚。
信源池(source pool):AI 在生成回答时,实际调用并引用的网页 / 平台 / 账号集合。AI 收到一个用户问题,先在自己的信源池里检索相关页面,再综合写一段回答。
英文世界的信源池有一个关键特征:ChatGPT、Perplexity、Gemini 之间共享大量稳定信源,以 Wikipedia + Reddit + 主流英文媒体为骨架。一篇内容进入 Wikipedia,几乎所有英文 AI 都会读到。
中文世界没有这种共享信源:
- 豆包优先调用字节自家平台的内容(抖音 / 头条 / 抖音百科)
- 文心优先调用百度自家平台的内容(百家号 / 百度百科 / 百度知道)
- 元宝优先调用微信生态的内容(公众号 / 视频号)
- DeepSeek 不绑定任何大厂生态,从公开网络抓
- 千问和 Kimi 各有各的策略
意味着同一篇内容必须分别发布到不同生态平台才能被不同 AI 引用。一篇内容覆盖 6 家 AI,工作量是 6 倍,而不是 1 倍。
6 大中文 AI 的信源构成对照
下面这张图把 6 家 AI 的"主源 / 次源 / 不抓"都列出来。看完之后你会知道,把内容发到哪个平台,能被哪家 AI 引用。
为什么会形成这种格局:3 个大厂自家生态 + 3 个不绑定大厂的 AI
把 6 家 AI 摊到一张图上,你会看到中文互联网只有三个独立的大厂自家生态(字节、腾讯、百度),以及不绑定任何大厂生态的另外 3 家 AI(DeepSeek / Kimi / 千问对话场景)。
为什么会形成这种格局?三个相互交织的原因:
原因 1:大厂训练数据天然倾向自家生态
字节家有抖音 + 头条这种百亿规模内容池,腾讯家有公众号 36 亿篇历史文章,百度家有百家号 + 百科 + 知道,这些内容对自家训练成本最低、合规可控、API 调用免费。让自家 AI 优先用自家内容,是商业上最优解。
原因 2:跨平台爬虫互相封锁
公众号的 robots.txt 默认屏蔽搜索引擎爬虫;抖音 / 头条对外部爬虫严格限制;百度索引也不开放给字节 / 腾讯。这种封锁是结构性的:不是"想抓抓不到",是各家平台主动设置规则不让对方抓。
原因 3:没有"中文 Wikipedia"作通用准入
英文世界 Wikipedia 是 ChatGPT 47.9% 的引用源、Gemini 直接读 Wikidata 知识图谱,它扮演了"所有 AI 都信任的公共信源"角色。中文 Wikipedia 在国内访问困难、编辑活跃度有限,没有任何一个中文百科产品获得了类似的"跨平台信任地位":百度百科只对文心有强加权,抖音百科只对豆包有强加权。
意味着你写的同一篇内容,要进入不同 AI 的视野,必须分别发布到不同生态平台。这就是这一课最重要的实操结论:发布策略路由。
现在动手做一次"信源反推"
步骤:
- 打开你品牌识别度最高的那家 AI
- 输入一个你期望被引用的问题,例如:“X 行业的工具有哪些"或"如何选择 X”,把 X 换成你的领域
- 仔细看 AI 给的答案里,它引用的网站 / 平台 / 账号都是什么类型
- 对照上面那张图,AI 引用的源落在哪个生态?
3 种典型结果:
- AI 引用的全是你预期之外的源(比如你以为应该被知乎引用,结果都是头条号)→ 你应该把内容也铺到那个生态去
- AI 引用的源和你已发布的位置匹配(比如你发了百家号,文心引用了百家号)→ 继续在这个生态深耕
- AI 引用的源很零散(每个 query 引的都不一样)→ 这家 AI 在你的领域信源不稳定,可能要等一段时间或换一家测
把这次反推的结果记下来,下面的"发布策略路由"会用得到。
发布策略路由表:你要被谁引用,就发哪里
把上面那张图反过来看,就是这张表:你目标的 AI 决定你该发的平台。
| 目标 AI | 优先发布渠道 | 次优渠道 | 备注 |
|---|---|---|---|
| 豆包 | 今日头条 + 抖音视频(含完整字幕) | 西瓜视频 + 抖音百科 / 快懂百科条目 | 视频转写信号最强;公众号几乎无效 |
| DeepSeek | CSDN 技术博客 + 搜狐号 / 网易号 | 知乎技术专栏 + GitHub README | 技术领域优先;无生态依赖 |
| 文心 | 百家号(核心) + 百度百科 / 百度知道 | 百度健康(医疗类) + 行业权威媒体 | 强依赖百度索引——做百度 SEO 同步受益 |
| 千问 | 网易号 / 搜狐号 | 学术站 / 企业白皮书 | 电商类需走淘宝商品页(另起策略) |
| 元宝 | 微信公众号 + 视频号字幕描述 | 腾讯文档(B 端) + 知乎 | 微信内嵌 AI 搜是封闭场——只有公众号 + 视频号能进 |
| Kimi | 高质量独立网站(被通用爬虫稳定抓取) | 学术 PDF / 长文档 | 没有"专门为 Kimi 优化"的生态——做通用 SEO 即可 |
怎么用这张表:
- 从 AI 倒推:你最在意被哪家引用?对照表找出对应的优先渠道。
- 从渠道正推:你已经在某个平台有内容积累?看它能影响哪几家 AI。
- 不要平均分配:6 家全做、每家做一点,比集中做 2 家差很多。生态优势是边际递增的,写第 10 篇头条号的边际收益远大于写 2 篇公众号 + 2 篇知乎 + 2 篇 CSDN 拼凑覆盖。
下一课会按"主体类型"(中小品牌 / 大品牌 / 出海 / B2B / 本地服务)告诉你具体先做哪一个生态。这一课先让你看到全图。
中文 AI 信源识别 3 个常见误区
误区 1:以为"全网铺设"就能覆盖所有 AI
很多团队的策略是"内容铺到所有平台",公众号、知乎、小红书、头条、百家号、CSDN 各发一篇相同内容。看起来很全,实际效果接近于在每个生态都只投了 1 篇。每个生态都需要持续更新 + 有一定深度才能被 AI 视为"权威源",单次铺设的引用价值极低。
误区 2:以为公众号是中文最大内容池所以覆盖率最高
公众号确实是中文最大内容池(36 亿篇),但它只对元宝有显著价值:豆包、文心、千问、DeepSeek、Kimi 抓公众号的比例显著偏低。原因:公众号 robots.txt 封锁通用爬虫 + 大厂之间互不开放。这是"内容量大 ≠ 引用面广"的典型反直觉案例。
误区 3:以为做百度 SEO 就能让所有中文 AI 引用
百度索引是文心的核心信源(强相关),但不是其他中文 AI 的输入。豆包用字节自家索引,元宝用腾讯自家索引 + 通用 web,DeepSeek 用通用网络爬虫,它们都不直接读百度索引。这和英文世界(ChatGPT / Bing Copilot 都用 Bing 索引)的根本差别。
反话术:服务商常说什么,你应该警惕什么
判定:❌ 大概率不成立。
公众号在元宝 / 微信搜一搜里确实是核心信源,但豆包优先抓字节系内容、文心优先抓百度系内容、千问优先抓网易号 / 搜狐号、DeepSeek 优先抓 CSDN / 知乎,它们抓公众号的比例显著偏低。如果服务商承诺"做 N 个公众号 = 覆盖所有中文 AI",警惕,这是把"在元宝有效"过度泛化成"在所有 AI 有效"。
判定:❌ 仅在部分 AI 部分品类成立。
知乎在 DeepSeek(技术类 query)+ 豆包(专业问答外部信源约 20%)里有一定权重,但不是所有中文 AI 都把知乎当"权威信源":文心几乎不引用知乎深度文章(百度生态封闭)、元宝引用知乎的比例显著低于公众号、千问偏好搜狐号 / 网易号而非知乎。如果服务商承诺"知乎账号矩阵 = 多 AI 覆盖",要让他列出"哪几家 AI、哪类 query、引用率多少",拿不出口径就是话术。
关键术语表
| 术语 | 解释 | 这一课怎么用 |
|---|---|---|
| 信源池 / Source Pool | AI 生成回答时调用并引用的网页 / 平台 / 账号集合 | 中文 AI 各家信源池几乎不重合 |
| 生态绑定 | 大厂自家 AI 优先调用自家内容池 | 豆包→字节、文心→百度、元宝→腾讯 |
| 跨平台爬虫封锁 | 一个平台的内容被另一个平台爬虫读不到 | 公众号封百度、抖音封百度等 |
| 通用准入 | 一个信源被多家 AI 共同信任 | 英文有 Wikipedia,中文没有对等物 |
| YMYL | Your Money or Your Life,关乎健康 / 金融的 query | 文心对这类 query 强加权官方机构 |
| 多模型路由 | 一个 AI 产品根据 query 类型调用不同底层模型 | 元宝在复杂推理时切到 DeepSeek R1 |
本课小结
- 信源池 = AI 生成回答时实际调用的网页 / 平台 / 账号集合:中文 AI 各家信源池几乎不重合,没有"通用准入"
- 3 个大厂自家生态:字节(豆包)、腾讯(元宝)、百度(文心)各自封闭,互不抓取
- 3 个不绑定大厂的 AI:DeepSeek(CSDN / 知乎 / 网易)、Kimi(通用 SEO 信号)、千问对话场景(网易号 / 搜狐号 / 不偏好自家电商内容)
- 同一篇内容必须分别发布到不同生态平台:一稿多投不等于一稿多发,每个生态需要单独深耕
- 目标 AI 决定优先渠道:豆包→头条 / 抖音、文心→百家号、元宝→公众号、DeepSeek→CSDN / 知乎
- 不要相信"一个矩阵覆盖所有 AI":公众号矩阵、知乎矩阵都是部分有效,要按生态分别评估
- 数据可信度低:所有"X 占比 60%“来自服务商口径,没有大规模独立复现,把它当方向不当精确指标
完成本课的下一步
做完上面的"信源反推"练习后,结合你的业务类型 + 现有内容资产,列出一份你自己的"发布优先级 1-3 表":你接下来 3 个月最该深耕的 1 个生态、其次 1 个、可以缓的 1 个。
这份优先级表会贯穿整个中文互联网篇,下一课讲"主体类型决策"时会用到,§5「平台对照」时也会回头对照。
下一课预告:第 3 课「主体合规:蓝 V / 黄 V / L3 等级到底有没有用」。把 GEO 服务商最常推销的"账号等级套餐"拆开看,分清"主体合规”(必须做)和"等级数字"(多数情况下无效)。
中文互联网篇 2/13 完成。如果你做了这一课的反推练习 + 列出了发布优先级表,你已经开始按生态分别投入,而不是把同一篇内容往所有平台铺。这是中文 GEO 最重要的策略调整。