这一课的'豆包 60% 头条'等数字可信度如何？

中等偏低。所有'X 平台占比 N%'数字都来自第三方 GEO 服务商分析（CSDN 博客 / 自媒体 / 服务商榜单），没有官方文档背书，没有大规模独立复现。3 家厂商（字节 / 百度 / DeepSeek）都未公开过引用机制细节。这一课的数字用来让你看清'生态绑定'的方向——不是精确指标。建议把'60%+'读成'显著高'、'中'读成'次要'、'低'读成'很少'。

我只能投一家——豆包 / 文心 / DeepSeek 选哪家？

看你的内容类型 + 用户主体。普通商业内容 / 中小品牌——优先豆包（用户量最大 + 字节生态相对开放）；YMYL 类（医疗 / 金融）—— 优先文心（百度对 YMYL 强加权 + 持牌主体的传导优势）；技术 / 编程 / 工程 / 开发者向——优先 DeepSeek（CSDN / 知乎技术问答信源池）。多数中小创作者第一年只做 1-2 家深耕，比 3 家都做但每家做得浅效果好。

文心助手 APP 和百度搜索 AI 答案位是同一回事吗？

不是。文心至少有 5 个产品入口（A 文心助手 APP / chat.baidu.com、B 百度搜索 AI 答案位、C 简单搜索 APP、D 百度文库 AI、E 千帆 API）——同公司、可能同模型，但**信源结构 + 触发逻辑 + 用户场景完全不同**。优化'百度搜索 AI 答案位'≈ 加强百度 SEO 基本盘；优化'文心助手 APP' ≈ 接近豆包 / DeepSeek 的 GEO 玩法。这一课的'文心实测'主要指 A + B 两个最高频入口。

DeepSeek 的'联网搜索'开关影响引用源吗？

显著影响。DeepSeek 官方 APP 在 UI 显示'联网搜索'开关——开启后调用联网检索，引用通用网络信源；不开启时仅用模型训练数据回答（无信源标注）。多数 GEO 实测必须开联网模式 ——否则你看到的是'模型记忆里的内容'而不是'AI 当前选择引用的内容'。注意：DeepSeek API 接入方（元宝 / 问小白等）的联网行为各自独立，跨产品不可迁移结论。

我做完豆包优化后 1 个月没看到引用率变化——是不是没起效？

大概率是时间不够。3 家中文 AI 的'引用更新周期'都不公开，但行业观察是 4-12 周——头部 GEO 服务商也通常承诺'3-6 个月看到引用率变化'。1 个月没变化是正常的；3 个月仍 0 变化才需要调整策略。同时检查：（1）你内容是否真的发到了对应生态（豆包看头条 + 抖音、不看公众号）；（2）你查的 query 是否合理（直接搜品牌名比搜行业问题更易看到引用）；（3）AI 的引用是否对你品牌识别度敏感（小品牌通常需要更长时间）。

第 6 课：豆包 / 文心 / DeepSeek 实测对照——3 家中文 AI 各偏好什么

你应该已经知道的

如果你做完了中文 §2、§5，你应该有这些认知：

6 大中文 AI 的信源池几乎不重合（中文 §2）
3 套合规体系是不同的东西（中文 §5）
算法备案 / 生成式 AI 备案 99% 内容创作者不需要做（中文 §5）

下一个问题：你打算投入哪家 AI、投入什么内容？这一课展开 3 家最重要的中文 AI 的实测对照：

豆包：用户量最大，月活 3.45 亿，字节生态闭环
文心：百度官方 AI，强依赖百度索引，5 个产品入口完全不同
DeepSeek：开源 / 不绑定大厂生态，技术 query 引用强

学完你能回答两个问题：

这 3 家分别偏好什么内容、什么发布渠道？
你的业务类型应该优先投哪家？

3 家 AI 对照框架

把 3 家 AI 放到同一个框架里看，4 个维度：信源池 / 时效偏好 / 结构偏好 / 实操可控点。

维度	豆包	文心	DeepSeek
信源池	字节生态闭环（头条 / 抖音 / 抖音百科）+ 知乎专业问答 ~20%	百度生态（百家号 / 百度百科 / 百度知道）+ 官方机构 / YMYL 类	通用网络爬取 + CSDN 技术博客 + 搜狐 / 网易号 + 知乎技术
时效偏好	短：1-2 周内权重最高，1 个月后显著下降	中：百度索引生态新鲜度（部分 query 倾向最新）	长：技术内容长效，资讯类仍需时效
结构偏好	FAQ / 列表 / 200-400 字段落	首段定义 + 数据 + 总结句	代码块 + 步骤化 + 参数表
实操可控点	头条号深度文 + 抖音视频字幕 + 抖音百科条目	百家号 + 百度百科条目 + 百度知道高质量回答	CSDN 技术博客 + GitHub README + 知乎技术专栏

核心观察：3 家各自的"偏好"反映了它们的底层数据来源差异：字节家有内容闭环（豆包用闭环）、百度有索引基础设施（文心用索引）、DeepSeek 没有大厂生态（用通用网络）。没有"一招通吃"的内容策略，必须分别做。

下面 3 节分别展开。

豆包：字节生态闭环 + 短时效窗口

豆包是用户量最大的中文 AI：QuestMobile 数据 2026Q1 月活 3.45 亿。这意味着同一个 GEO 投入，豆包的"被看到"量级显著高于其他中文 AI。

豆包 5 个偏好特征（待验证假说）

下面 5 条来自 GEO 服务商分析 + CSDN 博客整理，全部需要被视为待验证假说：

内部生态优先：今日头条深度文章（声称占比 60%+）+ 抖音内容（视频转写 / 评论 / 描述）+ 抖音百科 / 快懂百科。字节系内容相对其他源有显著加权
APP vs API 引用结构差异：APP 端（用户场景）字节系内容占比更高；API 端（开发者场景）信源更"通用"。意味着用 API 跑监测会系统性低估字节内部内容的真实权重
时效性偏短：1-2 周内的内容权重最高，超过 1 个月引用率显著下降，意味着内容生产侧需要持续更新
结构化偏好：FAQ 问答 / 列表对比 / 解释型短段落（200-400 字），大段散文论述被去优先级
YMYL 类偏好"权威信源"：央媒 / 政府门户 / 行业垂直媒体在医疗 / 金融 / 政策类 query 下被加权。但**“签央媒就能引用"是商业话术，不是机制证据**

投入豆包的 4 步路径

第 1 步：今日头条深度文章

主体认证（蓝 V / 黄 V）
首段直接定义 + 答案前置（参考基础 §4 的写法规则）
内容长度 1500-3000 字，分 H2 / H3 切段
持续更新：豆包时效偏好短，每月 4-6 篇优于一次发 30 篇

第 2 步：抖音视频 + 字幕

视频时长 1-3 分钟（短视频 AI 转写效率最高）
字幕用人工修正版本（自动字幕识别误差大，AI 引用质量低）
视频描述里写关键词 + 概念定义（不只是营销话术）
标题用问句式（参考基础 §4：什么是 X / 如何 X）

第 3 步：抖音百科 / 快懂百科条目

字节系结构化知识库，豆包 RAG 链路上权重高
适合品牌词 / 公司词条 / 产品词条
不是普通 SEO 内容，更接近"百科条目”：客观陈述 + 引用源

第 4 步：知乎专业问答（外部信源约 20% 占比）

在你领域的高赞问题下回答
答案需要"引用源 + 数据 + 自己经验"三件套
持续运营 1 个账号优于多账号铺设

豆包反话术

反话术 #1：豆包"60% 头条 + 20% 知乎"是精确权重
判定：⚠️ 数据来自 GEO 服务商口径，待独立验证。
"60%+"和"~20%"出自第三方 GEO 服务商，他们有动机放大字节内容的重要性以销售自己的服务（代发头条号 / 抖音矩阵服务）。字节官方未公开过任何引用源占比数据。这些数字应该被读作"字节内容是主源"+"知乎是次源"的相对方向，而不是"60% × 20%"的精确预算分配。如果服务商按"60% 头条预算 + 20% 知乎预算"做精细化报价，他在用一个未经验证的数字给你做精算。

文心：5 个产品入口 + 强依赖百度索引

文心的特殊性：不是一个 AI，是同一模型的 5 个产品入口。每个入口的信源结构、触发逻辑、用户场景完全不同。

文心 5 个产品入口

核心结论：

入口 A（文心助手 APP）：信源更广，可能更多采用通用 web 内容 + 实时联网，更接近豆包 / DeepSeek 的 GEO 玩法
入口 B（百度搜索 AI 答案位）：百度生态内容占比更高（搜索索引主导），优化 B ≈ 加强百度 SEO 基本盘
入口 C / D / E 信源逻辑各不同，本课不展开

下面的"投入路径"主要针对 A + B 两个最高频入口。

文心 4 个偏好特征

百度生态优先：百家号（核心引用源）+ 百度百科（知识类 query）+ 百度知道（问答类 query）+ 百度健康 / 百度医典（YMYL 强加权）
首段定义 + 数据 + 总结句结构：文心在解析内容时偏好这种三段式
YMYL 类对持牌主体强加权：医疗 / 金融 / 法律类 query 下，持资质机构内容显著优先
强依赖百度 SEO 基本盘：被百度索引收录是文心引用的前置条件，意味着文心 GEO 等于"百度 SEO + 一点 GEO 调料"

投入文心的 4 步路径

第 1 步：百度 SEO 基本盘

ICP 备案（中文 §5 讲过）
站点被百度收录（用百度搜索资源平台主动提交）
内容做百度算法友好（关键词布局 + E-E-A-T 信号）

第 2 步：百家号矩阵

蓝 V 认证（个人号也可以做黄 V）
持续发布原创内容（每周 2-3 篇）
结构遵守"首段定义 + 数据 + 总结句"

第 3 步：百度百科 / 百度知道条目

品牌词 / 产品词建立百科条目（注意百科有严格的 notability 门槛）
高质量回答百度知道核心 query

第 4 步（仅 YMYL 类）：医疗 / 金融资质 + 百度健康对接

不是 YMYL 类可跳过
YMYL 类必须有持牌主体，参考中文 §5 的合规清单

文心反话术

反话术 #2：百家号代发 = 文心引用率 +X%
判定：⚠️ 部分有效但量级不可预测。
百家号确实是文心的核心信源，但"代发"的具体效应取决于：（1）你的代发账号本身是否被百度信任（新号代发权重很低）；（2）内容质量是否过关（百度对低质重复内容反向降权）；（3）你的领域是否被文心覆盖（小众领域可能根本不召回）。服务商承诺"代发 N 篇 = 引用率 +X%"是数据自行编造。百度官方未公开过任何"代发 → 引用率"的量化关系。代发可以做（前提是用你自己的号 + 真实内容），但不要预期可预测的引用率提升。

DeepSeek：通用爬取 + 技术内容长效

DeepSeek 是 3 家中最不像中文 AI 的中文 AI：它没有大厂生态绑定、用户画像偏技术 / 编程 / 推理、信源池更接近"通用网络爬取 + 技术社区"。

DeepSeek 4 个偏好特征

技术社区与新闻媒体优先：CSDN 博客（技术 query 核心引用）+ 搜狐 / 网易号（通用资讯）+ 百科站点（百度百科 / 维基中文 / 抖音百科）+ 知乎技术问答 + GitHub 技术文档
联网搜索 vs 模型记忆：DeepSeek 官方 APP 的"联网搜索"开关，开启时调用通用网络检索，引用源标注；关闭时仅用模型训练数据，无信源标注
技术内容长效：技术问题答案随时间变化慢，DeepSeek 对编程 / 数学 / 推理类内容"无明确时效期限"，与豆包的 1-2 周时效形成对比
结构化偏好（与豆包共通）：代码块 / 架构图 / 参数表 / 步骤化解释（“原理 → 实现 → 边界”）

投入 DeepSeek 的 3 步路径

第 1 步：CSDN 技术博客

CSDN 在 DeepSeek 引用中的权重显著高于其他平台
内容必须真实技术深度（不是营销文案 + 关键词堆砌）
标题用问题式（如何解决 X / X 是什么 / X vs Y）

第 2 步：知乎技术专栏 + GitHub README

知乎技术问答在 DeepSeek 中也是次要信源
GitHub 项目的 README 被 DeepSeek 引用频率高（特别是开源工具类 query）
不是给非技术读者写，直接技术人写技术人

第 3 步：搜狐号 / 网易号通用资讯

这俩在 DeepSeek 通用 query 中是中等权重
不需要做矩阵，1 个账号持续更新即可

DeepSeek 反话术

反话术 #3：DeepSeek API 跑出来的引用结果 = DeepSeek 用户实际看到的
判定：❌ B 端不能等同 C 端。
DeepSeek API 是被多家产品（元宝 / 问小白 / 纳米 AI / 知乎直答等）接入的，每个接入方有自己的 RAG 配置。你跑 DeepSeek 官方 API 看到的引用源 ≠ 元宝用户在 APP 里看到的引用源 ≠ 知乎直答用户看到的引用源，三个产品的检索召回完全不同。如果你的目标是"被 DeepSeek 用户引用"，必须明确指哪个产品（官方 APP 还是某接入方），用对应产品做实测，不要用 API 数据外推。

现在动手做一次"3 家 AI 对照实测"

动手 15 分钟 不要等理论讲完，拿你品牌名 + 1 个核心 query，在 3 家 AI 跑一次，对比结果。

实测步骤：

第 1 步：选 query（建议 2 个）

Query 1：你品牌名 / 公司名（看品牌识别度）
Query 2：你领域的核心 query（如"如何选择 X" / “X 推荐”）

第 2 步：打开 3 个标签页

豆包：doubao.com
文心助手 APP：chat.baidu.com（入口 A）
DeepSeek：chat.deepseek.com，记得开"联网搜索"

第 3 步：用同一个 query 跑 3 家，记录：

AI	是否提及你品牌	引用源类型	答案准确度
豆包
文心
DeepSeek

第 4 步：解读

哪家提及了你 → 那家生态你已经有立足点，可以加深耕
哪家没提及 → 看引用源类型，你的内容应该往哪个生态发

典型结果：3 家中 0-1 家提及。这就是你的中文 GEO 起点，大多数中小品牌都是这个状态。

投哪家：3 步决策

回到这一课开头的问题：你应该优先投哪家？按下面 3 步选：

第 1 步：按内容类型选

内容类型	优先投	次选
普通商业内容 / 中小品牌	豆包	文心
YMYL 类（医疗 / 金融 / 法律）	文心	（需持牌主体）
技术 / 编程 / 工程 / 开发者向	DeepSeek	豆包（如果有视频内容）
B 端企业服务 / 知识管理	文心（百度文库 AI 入口）	千问（电商 / 阿里生态）
出海 / 全球用户	不是这 3 家，查国际生态篇	—

第 2 步：按现有内容资产选

已经在做百家号 / 百度 SEO → 加深文心
已经在做抖音 / 头条 → 加深豆包
已经在做 CSDN / GitHub → 加深 DeepSeek

第 3 步：按合规约束选

YMYL 类 + 无持牌主体 → 不投文心，转通用 query 走 DeepSeek
出海 / 境外主体 → 不投文心（备案障碍），考虑豆包（蓝 V 认证境外公司可办）/ DeepSeek（通用爬取门槛低）

核心规则：第 1 年只投 1-2 家深耕。3 家都做但每家做得浅 = 工作量翻 3 倍但每家信号都不够强。

关键术语表

术语	解释	这一课怎么用
信源池	AI 生成回答时调用的网页 / 平台 / 账号集合	3 家 AI 信源池几乎不重合
APP vs API 引用差异	同 AI 的用户端和开发者端引用结构不同	用 API 监测会低估字节内容
时效性窗口	AI 偏好"近期内容"的时间区间	豆包 1-2 周 / DeepSeek 长效
多入口同模型	同 AI 模型在不同产品入口里的表现差异	文心有 5 个入口
联网搜索开关	DeepSeek UI 上的检索增强开关	必须开启才能拿到信源标注
通用准入	一个信源被多家 AI 共同信任	中文世界没有这种通用准入
YMYL 强加权	医疗 / 金融 / 法律类对持牌主体的额外权重	文心对 YMYL 加权最强

本课小结

3 家中文 AI 各偏好不同：豆包→字节生态 / 文心→百度生态 / DeepSeek→通用网络 + 技术社区
豆包 5 个偏好：内部生态优先 / APP vs API 差异 / 1-2 周时效窗口 / FAQ + 列表结构 / YMYL 类权威信源
文心 5 个产品入口：A 文心助手 APP / B 百度搜索 AI 位 / C 简单搜索 / D 文库 AI / E 千帆 API，主要 GEO 目标是 A + B
DeepSeek 4 个偏好：CSDN 博客优先 / 联网搜索开关影响 / 技术内容长效 / 代码块 + 步骤化结构
APP vs API 不能默认等同：多家厂商在两端有显著差异，监测必须用对应产品
第 1 年只投 1-2 家深耕：3 家都做但每家浅 = 工作量翻 3 倍但信号都不够强
数字可信度低：所有"X% 占比"都来自服务商口径，没有官方数据，读作相对方向不是精确指标

完成本课的下一步

立即去做（30 分钟）
1. 跑"3 家 AI 对照实测"：同一个 query 在豆包 / 文心 / DeepSeek 跑一遍，记录结果
2. 按"3 步决策"选定你今年优先投的 1-2 家。明确选定，不要"3 家都做一点"
3. 把这个决策写下来，下个月对照本月数据看变化

下一课预告：第 7 课「中文 LLM 引用归因：把’被引用’拆开看」。把 §2-§6 讲过的"信源池 + 合规 + 平台对照"消化完后，回到归因层：你怎么知道哪个 AI 引用了你、引用率怎么算、ROI 怎么对照。

中文互联网篇 6/13 完成。如果你跑了 3 家 AI 对照实测 + 选定了 1-2 家深耕，你已经把"中文 GEO 全平台铺设"的话术陷阱过滤掉，进入了真正的"按生态深耕"阶段。

← 返回中文互联网篇目录

你应该已经知道的#

3 家 AI 对照框架#

豆包：字节生态闭环 + 短时效窗口#

豆包 5 个偏好特征（待验证假说）#

投入豆包的 4 步路径#

豆包反话术#

文心：5 个产品入口 + 强依赖百度索引#

文心 5 个产品入口#

文心 4 个偏好特征#

投入文心的 4 步路径#

文心反话术#

DeepSeek：通用爬取 + 技术内容长效#

DeepSeek 4 个偏好特征#

投入 DeepSeek 的 3 步路径#

DeepSeek 反话术#

现在动手做一次"3 家 AI 对照实测"#

投哪家：3 步决策#

关键术语表#

本课小结#

完成本课的下一步#

你应该已经知道的

3 家 AI 对照框架

豆包：字节生态闭环 + 短时效窗口

豆包 5 个偏好特征（待验证假说）

投入豆包的 4 步路径

豆包反话术

文心：5 个产品入口 + 强依赖百度索引

文心 5 个产品入口

文心 4 个偏好特征

投入文心的 4 步路径

文心反话术

DeepSeek：通用爬取 + 技术内容长效

DeepSeek 4 个偏好特征

投入 DeepSeek 的 3 步路径

DeepSeek 反话术

现在动手做一次"3 家 AI 对照实测"

投哪家：3 步决策

关键术语表

本课小结

完成本课的下一步