你应该已经知道的

如果你做完了中文 §2、§5,你应该有这些认知:

  • 6 大中文 AI 的信源池几乎不重合(中文 §2)
  • 3 套合规体系是不同的东西(中文 §5)
  • 算法备案 / 生成式 AI 备案 99% 内容创作者不需要做(中文 §5)

下一个问题:你打算投入哪家 AI、投入什么内容?这一课展开 3 家最重要的中文 AI 的实测对照:

  1. 豆包:用户量最大,月活 3.45 亿,字节生态闭环
  2. 文心:百度官方 AI,强依赖百度索引,5 个产品入口完全不同
  3. DeepSeek:开源 / 不绑定大厂生态,技术 query 引用强

学完你能回答两个问题:

  • 这 3 家分别偏好什么内容、什么发布渠道?
  • 你的业务类型应该优先投哪家?

3 家 AI 对照框架

把 3 家 AI 放到同一个框架里看,4 个维度:信源池 / 时效偏好 / 结构偏好 / 实操可控点。

维度 豆包 文心 DeepSeek
信源池 字节生态闭环(头条 / 抖音 / 抖音百科)+ 知乎专业问答 ~20% 百度生态(百家号 / 百度百科 / 百度知道)+ 官方机构 / YMYL 类 通用网络爬取 + CSDN 技术博客 + 搜狐 / 网易号 + 知乎技术
时效偏好 短:1-2 周内权重最高,1 个月后显著下降 中:百度索引生态新鲜度(部分 query 倾向最新) 长:技术内容长效,资讯类仍需时效
结构偏好 FAQ / 列表 / 200-400 字段落 首段定义 + 数据 + 总结句 代码块 + 步骤化 + 参数表
实操可控点 头条号深度文 + 抖音视频字幕 + 抖音百科条目 百家号 + 百度百科条目 + 百度知道高质量回答 CSDN 技术博客 + GitHub README + 知乎技术专栏

核心观察:3 家各自的"偏好"反映了它们的底层数据来源差异:字节家有内容闭环(豆包用闭环)、百度有索引基础设施(文心用索引)、DeepSeek 没有大厂生态(用通用网络)。没有"一招通吃"的内容策略,必须分别做。

下面 3 节分别展开。


豆包:字节生态闭环 + 短时效窗口

豆包是用户量最大的中文 AI:QuestMobile 数据 2026Q1 月活 3.45 亿。这意味着同一个 GEO 投入,豆包的"被看到"量级显著高于其他中文 AI。

豆包 5 个偏好特征(待验证假说)

下面 5 条来自 GEO 服务商分析 + CSDN 博客整理,全部需要被视为待验证假说

  1. 内部生态优先:今日头条深度文章(声称占比 60%+)+ 抖音内容(视频转写 / 评论 / 描述)+ 抖音百科 / 快懂百科。字节系内容相对其他源有显著加权
  2. APP vs API 引用结构差异:APP 端(用户场景)字节系内容占比更高;API 端(开发者场景)信源更"通用"。意味着用 API 跑监测会系统性低估字节内部内容的真实权重
  3. 时效性偏短:1-2 周内的内容权重最高,超过 1 个月引用率显著下降,意味着内容生产侧需要持续更新
  4. 结构化偏好:FAQ 问答 / 列表对比 / 解释型短段落(200-400 字),大段散文论述被去优先级
  5. YMYL 类偏好"权威信源":央媒 / 政府门户 / 行业垂直媒体在医疗 / 金融 / 政策类 query 下被加权。但**“签央媒就能引用"是商业话术,不是机制证据**

投入豆包的 4 步路径

第 1 步:今日头条深度文章

  • 主体认证(蓝 V / 黄 V)
  • 首段直接定义 + 答案前置(参考基础 §4 的写法规则)
  • 内容长度 1500-3000 字,分 H2 / H3 切段
  • 持续更新:豆包时效偏好短,每月 4-6 篇优于一次发 30 篇

第 2 步:抖音视频 + 字幕

  • 视频时长 1-3 分钟(短视频 AI 转写效率最高)
  • 字幕用人工修正版本(自动字幕识别误差大,AI 引用质量低)
  • 视频描述里写关键词 + 概念定义(不只是营销话术)
  • 标题用问句式(参考基础 §4:什么是 X / 如何 X)

第 3 步:抖音百科 / 快懂百科条目

  • 字节系结构化知识库,豆包 RAG 链路上权重高
  • 适合品牌词 / 公司词条 / 产品词条
  • 不是普通 SEO 内容,更接近"百科条目”:客观陈述 + 引用源

第 4 步:知乎专业问答(外部信源约 20% 占比)

  • 在你领域的高赞问题下回答
  • 答案需要"引用源 + 数据 + 自己经验"三件套
  • 持续运营 1 个账号优于多账号铺设

豆包反话术

反话术 #1:豆包"60% 头条 + 20% 知乎"是精确权重
判定:⚠️ 数据来自 GEO 服务商口径,待独立验证。
"60%+"和"~20%"出自第三方 GEO 服务商,他们有动机放大字节内容的重要性以销售自己的服务(代发头条号 / 抖音矩阵服务)。字节官方未公开过任何引用源占比数据。这些数字应该被读作"字节内容是主源"+"知乎是次源"的相对方向,而不是"60% × 20%"的精确预算分配。如果服务商按"60% 头条预算 + 20% 知乎预算"做精细化报价,他在用一个未经验证的数字给你做精算。

文心:5 个产品入口 + 强依赖百度索引

文心的特殊性:不是一个 AI,是同一模型的 5 个产品入口。每个入口的信源结构、触发逻辑、用户场景完全不同。

文心 5 个产品入口

文心的 5 个产品入口及其信源差异 文心 5 个产品入口(同模型 / 不同信源结构) 优化"文心 GEO"前必须先选具体入口 文心模型(同一个) 5 个产品入口共享底层 A 文心助手 APP chat.baidu.com 通用 RAG 类似豆包 APP 对话式 + 可追问 B 百度搜索 AI 位 搜索结果页内 百度索引主导 强依赖百度 SEO 触发取决于 query C 简单搜索 APP 无广告版本 百度索引 + 文心 UI 更纯粹 用户量较小 D 百度文库 AI 文库内容主导 + 通用知识 生产力场景 写作 / 总结 E 千帆 API 开发者接入 RAG 由接入方 自己决定 企业 B 端 主要 GEO 目标:A + B A:对话式 GEO(信源更广)/ B:搜索 GEO(百度索引主导) "文心 GEO"不是单一目标,必须先选入口再做策略 优化 B(百度搜索 AI 答案位)≈ 加强百度 SEO 基本盘 + 百家号 + 百度百科

核心结论

  • 入口 A(文心助手 APP):信源更广,可能更多采用通用 web 内容 + 实时联网,更接近豆包 / DeepSeek 的 GEO 玩法
  • 入口 B(百度搜索 AI 答案位):百度生态内容占比更高(搜索索引主导),优化 B ≈ 加强百度 SEO 基本盘
  • 入口 C / D / E 信源逻辑各不同,本课不展开

下面的"投入路径"主要针对 A + B 两个最高频入口。

文心 4 个偏好特征

  1. 百度生态优先:百家号(核心引用源)+ 百度百科(知识类 query)+ 百度知道(问答类 query)+ 百度健康 / 百度医典(YMYL 强加权)
  2. 首段定义 + 数据 + 总结句结构:文心在解析内容时偏好这种三段式
  3. YMYL 类对持牌主体强加权:医疗 / 金融 / 法律类 query 下,持资质机构内容显著优先
  4. 强依赖百度 SEO 基本盘:被百度索引收录是文心引用的前置条件,意味着文心 GEO 等于"百度 SEO + 一点 GEO 调料"

投入文心的 4 步路径

第 1 步:百度 SEO 基本盘

  • ICP 备案(中文 §5 讲过)
  • 站点被百度收录(用百度搜索资源平台主动提交)
  • 内容做百度算法友好(关键词布局 + E-E-A-T 信号)

第 2 步:百家号矩阵

  • 蓝 V 认证(个人号也可以做黄 V)
  • 持续发布原创内容(每周 2-3 篇)
  • 结构遵守"首段定义 + 数据 + 总结句"

第 3 步:百度百科 / 百度知道条目

  • 品牌词 / 产品词建立百科条目(注意百科有严格的 notability 门槛)
  • 高质量回答百度知道核心 query

第 4 步(仅 YMYL 类):医疗 / 金融资质 + 百度健康对接

  • 不是 YMYL 类可跳过
  • YMYL 类必须有持牌主体,参考中文 §5 的合规清单

文心反话术

反话术 #2:百家号代发 = 文心引用率 +X%
判定:⚠️ 部分有效但量级不可预测。
百家号确实是文心的核心信源,但"代发"的具体效应取决于:(1)你的代发账号本身是否被百度信任(新号代发权重很低);(2)内容质量是否过关(百度对低质重复内容反向降权);(3)你的领域是否被文心覆盖(小众领域可能根本不召回)。服务商承诺"代发 N 篇 = 引用率 +X%"是数据自行编造。百度官方未公开过任何"代发 → 引用率"的量化关系。代发可以做(前提是用你自己的号 + 真实内容),但不要预期可预测的引用率提升。

DeepSeek:通用爬取 + 技术内容长效

DeepSeek 是 3 家中最不像中文 AI 的中文 AI:它没有大厂生态绑定、用户画像偏技术 / 编程 / 推理、信源池更接近"通用网络爬取 + 技术社区"。

DeepSeek 4 个偏好特征

  1. 技术社区与新闻媒体优先:CSDN 博客(技术 query 核心引用)+ 搜狐 / 网易号(通用资讯)+ 百科站点(百度百科 / 维基中文 / 抖音百科)+ 知乎技术问答 + GitHub 技术文档
  2. 联网搜索 vs 模型记忆:DeepSeek 官方 APP 的"联网搜索"开关,开启时调用通用网络检索,引用源标注;关闭时仅用模型训练数据,无信源标注
  3. 技术内容长效:技术问题答案随时间变化慢,DeepSeek 对编程 / 数学 / 推理类内容"无明确时效期限",与豆包的 1-2 周时效形成对比
  4. 结构化偏好(与豆包共通):代码块 / 架构图 / 参数表 / 步骤化解释(“原理 → 实现 → 边界”)

投入 DeepSeek 的 3 步路径

第 1 步:CSDN 技术博客

  • CSDN 在 DeepSeek 引用中的权重显著高于其他平台
  • 内容必须真实技术深度(不是营销文案 + 关键词堆砌)
  • 标题用问题式(如何解决 X / X 是什么 / X vs Y)

第 2 步:知乎技术专栏 + GitHub README

  • 知乎技术问答在 DeepSeek 中也是次要信源
  • GitHub 项目的 README 被 DeepSeek 引用频率高(特别是开源工具类 query)
  • 不是给非技术读者写,直接技术人写技术人

第 3 步:搜狐号 / 网易号通用资讯

  • 这俩在 DeepSeek 通用 query 中是中等权重
  • 不需要做矩阵,1 个账号持续更新即可

DeepSeek 反话术

反话术 #3:DeepSeek API 跑出来的引用结果 = DeepSeek 用户实际看到的
判定:❌ B 端不能等同 C 端。
DeepSeek API 是被多家产品(元宝 / 问小白 / 纳米 AI / 知乎直答等)接入的,每个接入方有自己的 RAG 配置。你跑 DeepSeek 官方 API 看到的引用源 ≠ 元宝用户在 APP 里看到的引用源 ≠ 知乎直答用户看到的引用源,三个产品的检索召回完全不同。如果你的目标是"被 DeepSeek 用户引用",必须明确指哪个产品(官方 APP 还是某接入方),用对应产品做实测,不要用 API 数据外推。

现在动手做一次"3 家 AI 对照实测"

动手 15 分钟 不要等理论讲完,拿你品牌名 + 1 个核心 query,在 3 家 AI 跑一次,对比结果。

实测步骤

第 1 步:选 query(建议 2 个)

  • Query 1:你品牌名 / 公司名(看品牌识别度)
  • Query 2:你领域的核心 query(如"如何选择 X" / “X 推荐”)

第 2 步:打开 3 个标签页

第 3 步:用同一个 query 跑 3 家,记录:

AI 是否提及你品牌 引用源类型 答案准确度
豆包
文心
DeepSeek

第 4 步:解读

  • 哪家提及了你 → 那家生态你已经有立足点,可以加深耕
  • 哪家没提及 → 看引用源类型,你的内容应该往哪个生态发

典型结果:3 家中 0-1 家提及。这就是你的中文 GEO 起点,大多数中小品牌都是这个状态。


投哪家:3 步决策

回到这一课开头的问题:你应该优先投哪家?按下面 3 步选:

第 1 步:按内容类型选

内容类型 优先投 次选
普通商业内容 / 中小品牌 豆包 文心
YMYL 类(医疗 / 金融 / 法律) 文心 (需持牌主体)
技术 / 编程 / 工程 / 开发者向 DeepSeek 豆包(如果有视频内容)
B 端企业服务 / 知识管理 文心(百度文库 AI 入口) 千问(电商 / 阿里生态)
出海 / 全球用户 不是这 3 家,查国际生态篇

第 2 步:按现有内容资产选

  • 已经在做百家号 / 百度 SEO → 加深文心
  • 已经在做抖音 / 头条 → 加深豆包
  • 已经在做 CSDN / GitHub → 加深 DeepSeek

第 3 步:按合规约束选

  • YMYL 类 + 无持牌主体 → 不投 文心,转通用 query 走 DeepSeek
  • 出海 / 境外主体 → 不投 文心(备案障碍),考虑豆包(蓝 V 认证境外公司可办)/ DeepSeek(通用爬取门槛低)

核心规则:第 1 年只投 1-2 家深耕。3 家都做但每家做得浅 = 工作量翻 3 倍但每家信号都不够强。


关键术语表

术语 解释 这一课怎么用
信源池 AI 生成回答时调用的网页 / 平台 / 账号集合 3 家 AI 信源池几乎不重合
APP vs API 引用差异 同 AI 的用户端和开发者端引用结构不同 用 API 监测会低估字节内容
时效性窗口 AI 偏好"近期内容"的时间区间 豆包 1-2 周 / DeepSeek 长效
多入口同模型 同 AI 模型在不同产品入口里的表现差异 文心有 5 个入口
联网搜索开关 DeepSeek UI 上的检索增强开关 必须开启才能拿到信源标注
通用准入 一个信源被多家 AI 共同信任 中文世界没有这种通用准入
YMYL 强加权 医疗 / 金融 / 法律类对持牌主体的额外权重 文心对 YMYL 加权最强

本课小结

  1. 3 家中文 AI 各偏好不同:豆包→字节生态 / 文心→百度生态 / DeepSeek→通用网络 + 技术社区
  2. 豆包 5 个偏好:内部生态优先 / APP vs API 差异 / 1-2 周时效窗口 / FAQ + 列表结构 / YMYL 类权威信源
  3. 文心 5 个产品入口:A 文心助手 APP / B 百度搜索 AI 位 / C 简单搜索 / D 文库 AI / E 千帆 API,主要 GEO 目标是 A + B
  4. DeepSeek 4 个偏好:CSDN 博客优先 / 联网搜索开关影响 / 技术内容长效 / 代码块 + 步骤化结构
  5. APP vs API 不能默认等同:多家厂商在两端有显著差异,监测必须用对应产品
  6. 第 1 年只投 1-2 家深耕:3 家都做但每家浅 = 工作量翻 3 倍但信号都不够强
  7. 数字可信度低:所有"X% 占比"都来自服务商口径,没有官方数据,读作相对方向不是精确指标

完成本课的下一步

立即去做(30 分钟)
1. 跑"3 家 AI 对照实测":同一个 query 在豆包 / 文心 / DeepSeek 跑一遍,记录结果
2. 按"3 步决策"选定你今年优先投的 1-2 家。明确选定,不要"3 家都做一点"
3. 把这个决策写下来,下个月对照本月数据看变化

下一课预告:第 7 课「中文 LLM 引用归因:把’被引用’拆开看」。把 §2-§6 讲过的"信源池 + 合规 + 平台对照"消化完后,回到归因层:你怎么知道哪个 AI 引用了你、引用率怎么算、ROI 怎么对照。

中文互联网篇 6/13 完成。如果你跑了 3 家 AI 对照实测 + 选定了 1-2 家深耕,你已经把"中文 GEO 全平台铺设"的话术陷阱过滤掉,进入了真正的"按生态深耕"阶段。

← 返回中文互联网篇目录