你应该已经知道的
如果你做完了中文 §2、§5,你应该有这些认知:
- 6 大中文 AI 的信源池几乎不重合(中文 §2)
- 3 套合规体系是不同的东西(中文 §5)
- 算法备案 / 生成式 AI 备案 99% 内容创作者不需要做(中文 §5)
下一个问题:你打算投入哪家 AI、投入什么内容?这一课展开 3 家最重要的中文 AI 的实测对照:
- 豆包:用户量最大,月活 3.45 亿,字节生态闭环
- 文心:百度官方 AI,强依赖百度索引,5 个产品入口完全不同
- DeepSeek:开源 / 不绑定大厂生态,技术 query 引用强
学完你能回答两个问题:
- 这 3 家分别偏好什么内容、什么发布渠道?
- 你的业务类型应该优先投哪家?
3 家 AI 对照框架
把 3 家 AI 放到同一个框架里看,4 个维度:信源池 / 时效偏好 / 结构偏好 / 实操可控点。
| 维度 | 豆包 | 文心 | DeepSeek |
|---|---|---|---|
| 信源池 | 字节生态闭环(头条 / 抖音 / 抖音百科)+ 知乎专业问答 ~20% | 百度生态(百家号 / 百度百科 / 百度知道)+ 官方机构 / YMYL 类 | 通用网络爬取 + CSDN 技术博客 + 搜狐 / 网易号 + 知乎技术 |
| 时效偏好 | 短:1-2 周内权重最高,1 个月后显著下降 | 中:百度索引生态新鲜度(部分 query 倾向最新) | 长:技术内容长效,资讯类仍需时效 |
| 结构偏好 | FAQ / 列表 / 200-400 字段落 | 首段定义 + 数据 + 总结句 | 代码块 + 步骤化 + 参数表 |
| 实操可控点 | 头条号深度文 + 抖音视频字幕 + 抖音百科条目 | 百家号 + 百度百科条目 + 百度知道高质量回答 | CSDN 技术博客 + GitHub README + 知乎技术专栏 |
核心观察:3 家各自的"偏好"反映了它们的底层数据来源差异:字节家有内容闭环(豆包用闭环)、百度有索引基础设施(文心用索引)、DeepSeek 没有大厂生态(用通用网络)。没有"一招通吃"的内容策略,必须分别做。
下面 3 节分别展开。
豆包:字节生态闭环 + 短时效窗口
豆包是用户量最大的中文 AI:QuestMobile 数据 2026Q1 月活 3.45 亿。这意味着同一个 GEO 投入,豆包的"被看到"量级显著高于其他中文 AI。
豆包 5 个偏好特征(待验证假说)
下面 5 条来自 GEO 服务商分析 + CSDN 博客整理,全部需要被视为待验证假说:
- 内部生态优先:今日头条深度文章(声称占比 60%+)+ 抖音内容(视频转写 / 评论 / 描述)+ 抖音百科 / 快懂百科。字节系内容相对其他源有显著加权
- APP vs API 引用结构差异:APP 端(用户场景)字节系内容占比更高;API 端(开发者场景)信源更"通用"。意味着用 API 跑监测会系统性低估字节内部内容的真实权重
- 时效性偏短:1-2 周内的内容权重最高,超过 1 个月引用率显著下降,意味着内容生产侧需要持续更新
- 结构化偏好:FAQ 问答 / 列表对比 / 解释型短段落(200-400 字),大段散文论述被去优先级
- YMYL 类偏好"权威信源":央媒 / 政府门户 / 行业垂直媒体在医疗 / 金融 / 政策类 query 下被加权。但**“签央媒就能引用"是商业话术,不是机制证据**
投入豆包的 4 步路径
第 1 步:今日头条深度文章
- 主体认证(蓝 V / 黄 V)
- 首段直接定义 + 答案前置(参考基础 §4 的写法规则)
- 内容长度 1500-3000 字,分 H2 / H3 切段
- 持续更新:豆包时效偏好短,每月 4-6 篇优于一次发 30 篇
第 2 步:抖音视频 + 字幕
- 视频时长 1-3 分钟(短视频 AI 转写效率最高)
- 字幕用人工修正版本(自动字幕识别误差大,AI 引用质量低)
- 视频描述里写关键词 + 概念定义(不只是营销话术)
- 标题用问句式(参考基础 §4:什么是 X / 如何 X)
第 3 步:抖音百科 / 快懂百科条目
- 字节系结构化知识库,豆包 RAG 链路上权重高
- 适合品牌词 / 公司词条 / 产品词条
- 不是普通 SEO 内容,更接近"百科条目”:客观陈述 + 引用源
第 4 步:知乎专业问答(外部信源约 20% 占比)
- 在你领域的高赞问题下回答
- 答案需要"引用源 + 数据 + 自己经验"三件套
- 持续运营 1 个账号优于多账号铺设
豆包反话术
判定:⚠️ 数据来自 GEO 服务商口径,待独立验证。
"60%+"和"~20%"出自第三方 GEO 服务商,他们有动机放大字节内容的重要性以销售自己的服务(代发头条号 / 抖音矩阵服务)。字节官方未公开过任何引用源占比数据。这些数字应该被读作"字节内容是主源"+"知乎是次源"的相对方向,而不是"60% × 20%"的精确预算分配。如果服务商按"60% 头条预算 + 20% 知乎预算"做精细化报价,他在用一个未经验证的数字给你做精算。
文心:5 个产品入口 + 强依赖百度索引
文心的特殊性:不是一个 AI,是同一模型的 5 个产品入口。每个入口的信源结构、触发逻辑、用户场景完全不同。
文心 5 个产品入口
核心结论:
- 入口 A(文心助手 APP):信源更广,可能更多采用通用 web 内容 + 实时联网,更接近豆包 / DeepSeek 的 GEO 玩法
- 入口 B(百度搜索 AI 答案位):百度生态内容占比更高(搜索索引主导),优化 B ≈ 加强百度 SEO 基本盘
- 入口 C / D / E 信源逻辑各不同,本课不展开
下面的"投入路径"主要针对 A + B 两个最高频入口。
文心 4 个偏好特征
- 百度生态优先:百家号(核心引用源)+ 百度百科(知识类 query)+ 百度知道(问答类 query)+ 百度健康 / 百度医典(YMYL 强加权)
- 首段定义 + 数据 + 总结句结构:文心在解析内容时偏好这种三段式
- YMYL 类对持牌主体强加权:医疗 / 金融 / 法律类 query 下,持资质机构内容显著优先
- 强依赖百度 SEO 基本盘:被百度索引收录是文心引用的前置条件,意味着文心 GEO 等于"百度 SEO + 一点 GEO 调料"
投入文心的 4 步路径
第 1 步:百度 SEO 基本盘
- ICP 备案(中文 §5 讲过)
- 站点被百度收录(用百度搜索资源平台主动提交)
- 内容做百度算法友好(关键词布局 + E-E-A-T 信号)
第 2 步:百家号矩阵
- 蓝 V 认证(个人号也可以做黄 V)
- 持续发布原创内容(每周 2-3 篇)
- 结构遵守"首段定义 + 数据 + 总结句"
第 3 步:百度百科 / 百度知道条目
- 品牌词 / 产品词建立百科条目(注意百科有严格的 notability 门槛)
- 高质量回答百度知道核心 query
第 4 步(仅 YMYL 类):医疗 / 金融资质 + 百度健康对接
- 不是 YMYL 类可跳过
- YMYL 类必须有持牌主体,参考中文 §5 的合规清单
文心反话术
判定:⚠️ 部分有效但量级不可预测。
百家号确实是文心的核心信源,但"代发"的具体效应取决于:(1)你的代发账号本身是否被百度信任(新号代发权重很低);(2)内容质量是否过关(百度对低质重复内容反向降权);(3)你的领域是否被文心覆盖(小众领域可能根本不召回)。服务商承诺"代发 N 篇 = 引用率 +X%"是数据自行编造。百度官方未公开过任何"代发 → 引用率"的量化关系。代发可以做(前提是用你自己的号 + 真实内容),但不要预期可预测的引用率提升。
DeepSeek:通用爬取 + 技术内容长效
DeepSeek 是 3 家中最不像中文 AI 的中文 AI:它没有大厂生态绑定、用户画像偏技术 / 编程 / 推理、信源池更接近"通用网络爬取 + 技术社区"。
DeepSeek 4 个偏好特征
- 技术社区与新闻媒体优先:CSDN 博客(技术 query 核心引用)+ 搜狐 / 网易号(通用资讯)+ 百科站点(百度百科 / 维基中文 / 抖音百科)+ 知乎技术问答 + GitHub 技术文档
- 联网搜索 vs 模型记忆:DeepSeek 官方 APP 的"联网搜索"开关,开启时调用通用网络检索,引用源标注;关闭时仅用模型训练数据,无信源标注
- 技术内容长效:技术问题答案随时间变化慢,DeepSeek 对编程 / 数学 / 推理类内容"无明确时效期限",与豆包的 1-2 周时效形成对比
- 结构化偏好(与豆包共通):代码块 / 架构图 / 参数表 / 步骤化解释(“原理 → 实现 → 边界”)
投入 DeepSeek 的 3 步路径
第 1 步:CSDN 技术博客
- CSDN 在 DeepSeek 引用中的权重显著高于其他平台
- 内容必须真实技术深度(不是营销文案 + 关键词堆砌)
- 标题用问题式(如何解决 X / X 是什么 / X vs Y)
第 2 步:知乎技术专栏 + GitHub README
- 知乎技术问答在 DeepSeek 中也是次要信源
- GitHub 项目的 README 被 DeepSeek 引用频率高(特别是开源工具类 query)
- 不是给非技术读者写,直接技术人写技术人
第 3 步:搜狐号 / 网易号通用资讯
- 这俩在 DeepSeek 通用 query 中是中等权重
- 不需要做矩阵,1 个账号持续更新即可
DeepSeek 反话术
判定:❌ B 端不能等同 C 端。
DeepSeek API 是被多家产品(元宝 / 问小白 / 纳米 AI / 知乎直答等)接入的,每个接入方有自己的 RAG 配置。你跑 DeepSeek 官方 API 看到的引用源 ≠ 元宝用户在 APP 里看到的引用源 ≠ 知乎直答用户看到的引用源,三个产品的检索召回完全不同。如果你的目标是"被 DeepSeek 用户引用",必须明确指哪个产品(官方 APP 还是某接入方),用对应产品做实测,不要用 API 数据外推。
现在动手做一次"3 家 AI 对照实测"
实测步骤:
第 1 步:选 query(建议 2 个)
- Query 1:你品牌名 / 公司名(看品牌识别度)
- Query 2:你领域的核心 query(如"如何选择 X" / “X 推荐”)
第 2 步:打开 3 个标签页
- 豆包:doubao.com
- 文心助手 APP:chat.baidu.com(入口 A)
- DeepSeek:chat.deepseek.com,记得开"联网搜索"
第 3 步:用同一个 query 跑 3 家,记录:
| AI | 是否提及你品牌 | 引用源类型 | 答案准确度 |
|---|---|---|---|
| 豆包 | |||
| 文心 | |||
| DeepSeek |
第 4 步:解读
- 哪家提及了你 → 那家生态你已经有立足点,可以加深耕
- 哪家没提及 → 看引用源类型,你的内容应该往哪个生态发
典型结果:3 家中 0-1 家提及。这就是你的中文 GEO 起点,大多数中小品牌都是这个状态。
投哪家:3 步决策
回到这一课开头的问题:你应该优先投哪家?按下面 3 步选:
第 1 步:按内容类型选
| 内容类型 | 优先投 | 次选 |
|---|---|---|
| 普通商业内容 / 中小品牌 | 豆包 | 文心 |
| YMYL 类(医疗 / 金融 / 法律) | 文心 | (需持牌主体) |
| 技术 / 编程 / 工程 / 开发者向 | DeepSeek | 豆包(如果有视频内容) |
| B 端企业服务 / 知识管理 | 文心(百度文库 AI 入口) | 千问(电商 / 阿里生态) |
| 出海 / 全球用户 | 不是这 3 家,查国际生态篇 | — |
第 2 步:按现有内容资产选
- 已经在做百家号 / 百度 SEO → 加深文心
- 已经在做抖音 / 头条 → 加深豆包
- 已经在做 CSDN / GitHub → 加深 DeepSeek
第 3 步:按合规约束选
- YMYL 类 + 无持牌主体 → 不投 文心,转通用 query 走 DeepSeek
- 出海 / 境外主体 → 不投 文心(备案障碍),考虑豆包(蓝 V 认证境外公司可办)/ DeepSeek(通用爬取门槛低)
核心规则:第 1 年只投 1-2 家深耕。3 家都做但每家做得浅 = 工作量翻 3 倍但每家信号都不够强。
关键术语表
| 术语 | 解释 | 这一课怎么用 |
|---|---|---|
| 信源池 | AI 生成回答时调用的网页 / 平台 / 账号集合 | 3 家 AI 信源池几乎不重合 |
| APP vs API 引用差异 | 同 AI 的用户端和开发者端引用结构不同 | 用 API 监测会低估字节内容 |
| 时效性窗口 | AI 偏好"近期内容"的时间区间 | 豆包 1-2 周 / DeepSeek 长效 |
| 多入口同模型 | 同 AI 模型在不同产品入口里的表现差异 | 文心有 5 个入口 |
| 联网搜索开关 | DeepSeek UI 上的检索增强开关 | 必须开启才能拿到信源标注 |
| 通用准入 | 一个信源被多家 AI 共同信任 | 中文世界没有这种通用准入 |
| YMYL 强加权 | 医疗 / 金融 / 法律类对持牌主体的额外权重 | 文心对 YMYL 加权最强 |
本课小结
- 3 家中文 AI 各偏好不同:豆包→字节生态 / 文心→百度生态 / DeepSeek→通用网络 + 技术社区
- 豆包 5 个偏好:内部生态优先 / APP vs API 差异 / 1-2 周时效窗口 / FAQ + 列表结构 / YMYL 类权威信源
- 文心 5 个产品入口:A 文心助手 APP / B 百度搜索 AI 位 / C 简单搜索 / D 文库 AI / E 千帆 API,主要 GEO 目标是 A + B
- DeepSeek 4 个偏好:CSDN 博客优先 / 联网搜索开关影响 / 技术内容长效 / 代码块 + 步骤化结构
- APP vs API 不能默认等同:多家厂商在两端有显著差异,监测必须用对应产品
- 第 1 年只投 1-2 家深耕:3 家都做但每家浅 = 工作量翻 3 倍但信号都不够强
- 数字可信度低:所有"X% 占比"都来自服务商口径,没有官方数据,读作相对方向不是精确指标
完成本课的下一步
1. 跑"3 家 AI 对照实测":同一个 query 在豆包 / 文心 / DeepSeek 跑一遍,记录结果
2. 按"3 步决策"选定你今年优先投的 1-2 家。明确选定,不要"3 家都做一点"
3. 把这个决策写下来,下个月对照本月数据看变化
下一课预告:第 7 课「中文 LLM 引用归因:把’被引用’拆开看」。把 §2-§6 讲过的"信源池 + 合规 + 平台对照"消化完后,回到归因层:你怎么知道哪个 AI 引用了你、引用率怎么算、ROI 怎么对照。
中文互联网篇 6/13 完成。如果你跑了 3 家 AI 对照实测 + 选定了 1-2 家深耕,你已经把"中文 GEO 全平台铺设"的话术陷阱过滤掉,进入了真正的"按生态深耕"阶段。