第 6 课：Schema 结构化数据——给 AI 读的'机器可读说明书'

Q: Schema 不是排名因子吗？为什么这一课说它对 GEO 很重要？

传统 SEO 时代 schema 主要为了'赢得 Google 富片段'——确实不是排名因子。但 GEO 时代 schema 的意义根本不同：**它是给 AI 模型读的'机器可读说明书'——是实体识别加速器**。一个完整的实体图谱（通过 Organization + Person + sameAs 表达）显著提升所有 AI 平台的引用概率。AI 在判断'这个品牌真的存在 + 是这个领域的权威 + 应该被引用'时，schema 是最直接的可机读信号。

上一课你修了 SSR 让 AI 爬虫读到内容——但 AI 仍然不知道'你是谁'。Schema 结构化数据就是给 AI 的机器可读说明书：12 组件评分细则 + 6 个关键 schema 完整模板（Organization / Article+Person / Product / SoftwareApplication）+ HowTo 已废弃 / FAQPage 受限的 2023 重大变化 + JS 注入 schema 的陷阱。

上一课你解决了什么

如果你做完了国际 §5 的 SSR 修复 + robots.txt 配置 + Core Web Vitals，AI 爬虫现在能正确读到你的内容。

但下一个问题来了：AI 读到了内容，仍然不知道"你是谁"。

打开你网站首页，问自己 3 个问题：

AI 怎么知道你是一个组织（不是一个人 / 一篇文章 / 一个产品列表）？
AI 怎么知道你和"LinkedIn 上同名公司"是同一个实体？
AI 怎么知道你的内容作者是一个有专业资质的人，不是一个匿名机器人？

这 3 个问题的答案是同一件事：Schema 结构化数据，一份给 AI 读的"机器可读说明书"。

这一课讲清楚 4 件事：

Schema 在 6 维体系里占 10%，但它是实体识别加速器，影响远大于 10%
6 个关键 schema 完整模板（Organization / LocalBusiness / Article+Person / Product / SoftwareApplication / WebSite）
2023 年的两个重大变化：HowTo 已废弃 / FAQPage 受限，你之前学的可能过时了
JS 注入 schema 的陷阱：前端框架默认行为让 AI 看不到 schema

学完你能用 1-2 小时把核心 schema 部署到你的站点，把 AI 引用率从"AI 不知道你是谁"推到"AI 把你识别为完整实体"。

Schema 是什么

先把这个核心概念定义清楚。

Schema（schema.org 词汇表）：一套被 Google / Bing / 主要 AI 厂商共同支持的"实体描述词汇表"。你用 JSON-LD 格式把你的页面"是什么"告诉爬虫，爬虫直接拿到结构化事实，不需要从自由文本里推断。

JSON-LD 是 Schema 的推荐格式：

<script type="application/ld+json">
{
  "@context": "https://schema.org",
  "@type": "Organization",
  "name": "Your Brand",
  "url": "https://yourdomain.com"
}
</script>

这段 JSON 直接告诉爬虫：“这个页面属于一个组织，名字叫 Your Brand，主页是 yourdomain.com”。AI 拿到这条信息，就把"Your Brand"当成已识别的实体，不需要从页面文本里猜。

关键概念：Schema 是 AI 的实体识别加速器 传统 SEO 时代 schema 主要为了"赢得 Google 富片段"，所以多数人觉得 "schema 不是排名因子"。GEO 时代意义根本不同：schema 是 AI 模型理解和信任你的实体的方式。一个完整的实体图谱（Organization + Person + sameAs）显著提升所有 AI 平台的引用概率。

常见问题

Schema 不是排名因子吗？为什么这一课说它对 GEO 很重要？

传统 SEO 时代 schema 主要为了"赢得 Google 富片段"——确实不是排名因子。但 GEO 时代 schema 的意义根本不同：**它是给 AI 模型读的"机器可读说明书"——是实体识别加速器**。一个完整的实体图谱（通过 Organization + Person + sameAs 表达）显著提升所有 AI 平台的引用概率。AI 在判断"这个品牌真的存在 + 是这个领域的权威 + 应该被引用"时，schema 是最直接的可机读信号。

HowTo schema 已废弃了——我之前写的还要删吗？

不必删，但要重新评估目的。Google 在 2023 年 9 月把 HowTo 从富片段移除——意味着 Google 搜索结果里**不再显示**HowTo 富片段。但 HowTo schema 本身仍然合法，AI 模型仍可以解析它作为语义信号。判别口径：（1）如果你写 HowTo 是为了 Google 富片段——删掉以减页面体积；（2）如果你写 HowTo 是为了让 AI 更好理解你的"步骤式内容"——保留作为 AI 语义信号。FAQPage 同理（2023-08 受限），但 AI 仍读 Q&A 语义。

我的网站用 React/Vue——schema 应该怎么注入才能被 AI 看到？

必须放在初始 HTML 响应里，不能靠前端框架的 portal 注入。Google 2025 年 12 月官方指南明确：JS 注入的 JSON-LD 可能被延迟处理，AI 爬虫完全看不到。检测方法：`curl https://yoursite.com/page | grep "application/ld+json"`——如果 grep 没命中，schema 就是 JS 注入的，需要改成 SSR 输出（参考国际 §5 讲过的 Next.js / Nuxt SSR 配置）。这点和国际 §5 的 SSR 检测是同一个根因——前端框架默认行为对 GEO 不友好。

sameAs 数组里我应该填多少个平台？

至少 5 个，最理想 10+ 个。sameAs 在 Schema 12 组件里满分 15（每个有效 sameAs 3 分，封顶 15）——意味着 5 个平台就能拿满分。但 5 个只是"满分门槛"——实际 AI 用 sameAs 做实体识别，平台越多识别越准确。优先级：Wikipedia > Wikidata > LinkedIn > YouTube > Twitter > Facebook > Crunchbase > GitHub > Google Scholar > ORCID > Instagram > 行业垂直目录。详见国际 §3 讲的 14 个推荐平台。

我做的是 SaaS 产品——Article schema 和 SoftwareApplication schema 都要做吗？

都做但用在不同页面。SoftwareApplication schema 用在你的产品页 / 主页（描述产品本身：定价 / 功能 / 评分）；Article schema 用在你的博客 / 教程 / 行业洞察文章页（描述内容 + 作者 byline）。一个 SaaS 网站典型 schema 分布：主页 = Organization + WebSite + SearchAction；产品页 = SoftwareApplication；博客文章 = Article + Person（作者）+ Organization（publisher）。每页只放该页该有的 schema，不要把所有 schema 堆到首页。