上一篇你做了什么
如果你刚学完基础篇,应该已经做过"自我可见性测试",在 Google、百度、豆包、ChatGPT 各搜一下自己。
这一篇我们把"中文 AI 那一栏"展开。不是 1 次测试,是 6 次。
为什么是 6 次?因为中文 AI 不是一个统一市场。
一个让人不舒服的事实
中文 LLM 之间的引用源重合度低于 50%。
什么意思?同样一个问题,豆包给你引用 5 个网站、DeepSeek 给你引用 5 个网站,这两组 5 个网站可能只有 1-2 个重合,剩下的全是各家独有的信源池。
对比英文世界:ChatGPT 和 Perplexity 的引用源重合度通常超过 70%,因为它们都用 Bing 索引、都重度依赖 Wikipedia。在英文世界,一个品牌只要进入 Wikipedia + Reddit + 主流媒体,就能在多数英文 AI 里都有存在感。
中文世界没有这个"通用信源池"。每家中文 AI 都绑定自己的生态:
意味着:你想被 AI 引用,要么挑一家集中打,要么 6 家都做。没有"在 A 平台爆款,B 平台自然跟上"这种事。
这是中文 GEO 必须独立成一篇的根本原因。国际方法论里那套"做 schema、做 llms.txt、做 Wikipedia 实体",搬到中文几乎全部失效。中文 AI 的可见性逻辑根本不是这一套。
现在动手:6 次自我测试
| AI | 网址 | 备注 |
|---|---|---|
| 豆包 | doubao.com | 字节系,记得开"网页搜索" |
| DeepSeek | chat.deepseek.com | 必须打开"联网搜索"开关 |
| 文心一言 | yiyan.baidu.com | 百度系 |
| 通义千问 | tongyi.aliyun.com | 阿里系,APP 体验更完整 |
| 腾讯元宝 | yuanbao.tencent.com | 公众号源在这里有特殊地位 |
| Kimi | kimi.moonshot.cn | 月之暗面 |
每个 AI 测完后,记 4 件事:
- 它认不认识你?(完全不认识 / 给出一些模糊描述 / 准确描述 / 准确并标注来源)
- 如果引用了,引了哪些来源?(看引用形态:上标编号 / 行内引用 / 卡片化)
- 来源能点击吗?是真链接还是伪链接?
- 来源是不是同主体生态?(豆包引用的是不是抖音?元宝引用的是不是公众号?)
你大概率会发现的 4 个模式
做完 6 次测试,多数人会看到这 4 件事:
模式 1:完全不存在的 AI 占多数
6 个 AI 里,有 4-5 个会完全不认识你。这是常态,不是你做错了什么。
意味着:中文 GEO 的起点比你想的低。让 1 家 AI 引用你,已经是显著进步。不要一上来追求"6 家都引用"。
模式 2:引用形态完全不一样
豆包给你卡片化引用(带缩略图、来源 logo),DeepSeek 给你末尾参考链接,文心给你百度系特色样式。同一句"被引用",呈现完全不同。
意味着:卡片化的引用对用户的影响显著高于纯文字链接。你被豆包卡片化引用 1 次的曝光价值,可能 > 被 Kimi 纯文字引用 5 次。
模式 3:生态绑定明显
仔细看 6 个 AI 的引用源,你会发现:
- 豆包主要引用抖音视频、今日头条文章、番茄小说,全是字节系内容
- 元宝主要引用微信公众号、视频号
- 文心主要引用百家号、百度百科、百度健康
- 千问电商类查询会引用淘宝商品
- DeepSeek 引用源最"中性",没有自家生态绑定
- Kimi 介于"中性抓取"和"轻度生态绑定"之间
意味着:你不是在做 GEO,你是在选生态。决定"我要在哪几家 AI 里有存在感"等于决定"我要在哪几个内容生态里布局"。
模式 4:被引用的 ≠ 被点击的
如果你已经有一些 AI 引用,看一下被引用的源,再问自己:用户看到 AI 答案后,会想点这个引用源吗?
多半不会。AI 答案已经把核心信息合成了,用户没什么动力点。Google AI Overviews 的实测引用源 CTR 只有 1-1.3%,中文 AI 大概率更低。
6 大中文 AI 横向对照表
把上面观察到的模式整理成一张你可以收藏的对照表:
| AI | 信源生态 | 引用形态 | 是否绑定单一搜索 | 适合谁主要做 |
|---|---|---|---|---|
| 豆包 | 抖音 + 头条 + 字节系 | 卡片化 + 上标编号 | 自家搜索 | 视频内容 / 字节系账号矩阵 |
| DeepSeek | GitHub + 知乎 + 学术 + 通用网页 | 上标 + 末尾列表 | 不绑定(最"原生") | 技术 / B2B / 知乎运营者 |
| 文心一言 | 百家号 + 百度百科 + 百度全家桶 | 行内引用 + 末尾列表 | 百度搜索 | 已有百度系资产的 |
| 通义千问 | 淘宝 + 阿里系 + 通用 | 上标 + 部分商品卡 | 不强绑定 | 电商 / 商品类 query |
| 腾讯元宝 | 微信公众号 36 亿池 + 视频号 + 通用 | 上标 + 公众号专属卡片(APP 内可直接调起公众号) | 微信生态 | 公众号长期运营者 |
| Kimi | 网页抓取(无强生态) | 行内 + 末尾列表 | 不绑定 | 内容站 / 长文档场景 |
一个反直觉的结论:中小新品牌中文 GEO ROI 偏低
如果你是一个没有品牌识别度的新内容创作者,做完上面的测试后,你可能想问:“那我应该怎么开始?”
最诚实的答案是:先别做。
中小新品牌做中文 GEO 的 ROI 结构性偏低,原因有 3 个:
- 被引用而不被点击:用户记不住一个不熟悉的品牌名,“被看见"不能转化为"被记住”
- 信源生态壁垒:进入豆包/元宝的引用池需要在抖音/公众号有持续投入,单做内容门槛高
- 机会成本:同样的内容投入,在 SEO 蓝链或者私域内容上可能 ROI 更明确
对中小新品牌的建议(这一篇会反复出现):
- 先把 SEO 蓝链 / 私域内容做扎实,这是任何 GEO 工作的前提
- GEO 投入控制在总营销预算的 < 20%
- 优先做"短视频 + 私域",而不是"被 AI 引用"
如果你已经有一定品牌识别度(中型/大型品牌、行业内已知的内容创作者),中文 GEO 的 ROI 会显著提升,因为"被引用"能转化为品牌强化的累积信号。
这一篇要带你去哪
这是中文互联网篇的入口。后面 12 节课的逻辑:
| 课程 | 核心问题 |
|---|---|
| 第 2 课 中文 AI 信源生态地图 | 6 大中文 AI 各自抓什么内容,凭什么决定引用谁 |
| 第 3 课 账号体系与权威信号 | 蓝 V/黄 V/L3 等级——哪些有用,哪些是话术 |
| 第 4 课 私域 vs 公域信源 5 档光谱 | 你的内容在多公开的层面 |
| 第 5 课 平台相互封锁与可见性 | 为什么"全平台覆盖"在中文是硬约束 |
| 第 6 课 多模态信源采纳 | 图里文字 > alt 标签的反直觉结论 |
| 第 7 课 百度 SEO + AI Overview | 唯一有官方算法文档的平台 |
| 第 8 课 知乎机制与 GEO | 29.9% 引用率拆解 |
| 第 9 课 小红书:站内 SEO + GEO 双重角色 | 商业数据加权趋势 |
| 第 10 课 微信生态 | 公众号 + 搜一搜 + 元宝 36 亿文章池 |
| 第 11 课 字节生态 + 阿里生态 | 豆包 / 头条 / 抖音;千问 / 淘宝 |
| 第 12 课 中文 GEO ROI 框架 | 决定你该做多少 |
| 第 13 课 实战 | 选一个平台做完整审计 |
关键术语表
| 术语 | 含义 |
|---|---|
| 信源池 | 一个 LLM 实际从哪些网站抓内容做引用 |
| 信源生态 | LLM 与某个内容平台的绑定关系(豆包←→字节系、元宝←→微信) |
| 引用形态 | LLM 把"引用"呈现给用户的方式(卡片化 / 行内 / 末尾列表) |
| 引用源 CTR | 被引用的来源被用户实际点击的比例 |
| 信号价值 vs 回流价值 | “被看到"vs"被点击”——两者可以独立存在 |
| 主体类型 | 中小新品牌 / 中型 / 大型 / 出海 / YMYL / B2B——不同主体的 GEO ROI 完全不同 |
本课小结
- 中文 LLM 信源池重合度 < 50%:和英文世界 70% 重合的格局完全不同,必须分别做
- 6 大中文 AI 各有生态绑定:豆包←抖音/头条;元宝←公众号;文心←百度系;千问←淘宝;DeepSeek/Kimi 相对中性
- 引用形态决定信号价值:卡片化(豆包/元宝)> 行内引用(文心/Kimi)> 末尾列表(DeepSeek)
- 被引用 ≠ AI 流量:引用源 CTR < 1.3%(Google 数据,中文更低),这是品牌曝光不是流量
- 中小新品牌中文 GEO ROI 偏低:先做 SEO + 私域,GEO 投入 < 20% 营销预算
- 服务商话术 3 类陷阱:schema 万能、被引用=流量、GEO 普世必投,这一篇会持续教你识别
下一课:6 大中文 AI 信源生态地图。各家凭什么决定引用谁,你怎么进入它们的信源池。