上一课你解决了什么

如果你做完了国际 §5 的 SSR 修复 + robots.txt 配置 + Core Web Vitals,AI 爬虫现在能正确读到你的内容。

但下一个问题来了:AI 读到了内容,仍然不知道"你是谁"

打开你网站首页,问自己 3 个问题:

  • AI 怎么知道你是一个组织(不是一个人 / 一篇文章 / 一个产品列表)?
  • AI 怎么知道你和"LinkedIn 上同名公司"是同一个实体
  • AI 怎么知道你的内容作者是一个有专业资质的人,不是一个匿名机器人?

这 3 个问题的答案是同一件事:Schema 结构化数据,一份给 AI 读的"机器可读说明书"。

这一课讲清楚 4 件事:

  1. Schema 在 6 维体系里占 10%,但它是实体识别加速器,影响远大于 10%
  2. 6 个关键 schema 完整模板(Organization / LocalBusiness / Article+Person / Product / SoftwareApplication / WebSite)
  3. 2023 年的两个重大变化:HowTo 已废弃 / FAQPage 受限,你之前学的可能过时了
  4. JS 注入 schema 的陷阱:前端框架默认行为让 AI 看不到 schema

学完你能用 1-2 小时把核心 schema 部署到你的站点,把 AI 引用率从"AI 不知道你是谁"推到"AI 把你识别为完整实体"。


Schema 是什么

先把这个核心概念定义清楚。

Schema(schema.org 词汇表):一套被 Google / Bing / 主要 AI 厂商共同支持的"实体描述词汇表"。你用 JSON-LD 格式把你的页面"是什么"告诉爬虫,爬虫直接拿到结构化事实,不需要从自由文本里推断。

JSON-LD 是 Schema 的推荐格式

<script type="application/ld+json">
{
  "@context": "https://schema.org",
  "@type": "Organization",
  "name": "Your Brand",
  "url": "https://yourdomain.com"
}
</script>

这段 JSON 直接告诉爬虫:“这个页面属于一个组织,名字叫 Your Brand,主页是 yourdomain.com”。AI 拿到这条信息,就把"Your Brand"当成已识别的实体,不需要从页面文本里猜。

关键概念:Schema 是 AI 的实体识别加速器 传统 SEO 时代 schema 主要为了"赢得 Google 富片段",所以多数人觉得 "schema 不是排名因子"。GEO 时代意义根本不同:schema 是 AI 模型理解和信任你的实体的方式。一个完整的实体图谱(Organization + Person + sameAs)显著提升所有 AI 平台的引用概率。