上一课你解决了什么
如果你做完了国际 §5 的 SSR 修复 + robots.txt 配置 + Core Web Vitals,AI 爬虫现在能正确读到你的内容。
但下一个问题来了:AI 读到了内容,仍然不知道"你是谁"。
打开你网站首页,问自己 3 个问题:
- AI 怎么知道你是一个组织(不是一个人 / 一篇文章 / 一个产品列表)?
- AI 怎么知道你和"LinkedIn 上同名公司"是同一个实体?
- AI 怎么知道你的内容作者是一个有专业资质的人,不是一个匿名机器人?
这 3 个问题的答案是同一件事:Schema 结构化数据,一份给 AI 读的"机器可读说明书"。
这一课讲清楚 4 件事:
- Schema 在 6 维体系里占 10%,但它是实体识别加速器,影响远大于 10%
- 6 个关键 schema 完整模板(Organization / LocalBusiness / Article+Person / Product / SoftwareApplication / WebSite)
- 2023 年的两个重大变化:HowTo 已废弃 / FAQPage 受限,你之前学的可能过时了
- JS 注入 schema 的陷阱:前端框架默认行为让 AI 看不到 schema
学完你能用 1-2 小时把核心 schema 部署到你的站点,把 AI 引用率从"AI 不知道你是谁"推到"AI 把你识别为完整实体"。
Schema 是什么
先把这个核心概念定义清楚。
Schema(schema.org 词汇表):一套被 Google / Bing / 主要 AI 厂商共同支持的"实体描述词汇表"。你用 JSON-LD 格式把你的页面"是什么"告诉爬虫,爬虫直接拿到结构化事实,不需要从自由文本里推断。
JSON-LD 是 Schema 的推荐格式:
<script type="application/ld+json">
{
"@context": "https://schema.org",
"@type": "Organization",
"name": "Your Brand",
"url": "https://yourdomain.com"
}
</script>
这段 JSON 直接告诉爬虫:“这个页面属于一个组织,名字叫 Your Brand,主页是 yourdomain.com”。AI 拿到这条信息,就把"Your Brand"当成已识别的实体,不需要从页面文本里猜。
关键概念:Schema 是 AI 的实体识别加速器
传统 SEO 时代 schema 主要为了"赢得 Google 富片段",所以多数人觉得 "schema 不是排名因子"。GEO 时代意义根本不同:schema 是 AI 模型理解和信任你的实体的方式。一个完整的实体图谱(Organization + Person + sameAs)显著提升所有 AI 平台的引用概率。
常见问题
Schema 不是排名因子吗?为什么这一课说它对 GEO 很重要?
传统 SEO 时代 schema 主要为了"赢得 Google 富片段"——确实不是排名因子。但 GEO 时代 schema 的意义根本不同:**它是给 AI 模型读的"机器可读说明书"——是实体识别加速器**。一个完整的实体图谱(通过 Organization + Person + sameAs 表达)显著提升所有 AI 平台的引用概率。AI 在判断"这个品牌真的存在 + 是这个领域的权威 + 应该被引用"时,schema 是最直接的可机读信号。
HowTo schema 已废弃了——我之前写的还要删吗?
不必删,但要重新评估目的。Google 在 2023 年 9 月把 HowTo 从富片段移除——意味着 Google 搜索结果里**不再显示**HowTo 富片段。但 HowTo schema 本身仍然合法,AI 模型仍可以解析它作为语义信号。判别口径:(1)如果你写 HowTo 是为了 Google 富片段——删掉以减页面体积;(2)如果你写 HowTo 是为了让 AI 更好理解你的"步骤式内容"——保留作为 AI 语义信号。FAQPage 同理(2023-08 受限),但 AI 仍读 Q&A 语义。
我的网站用 React/Vue——schema 应该怎么注入才能被 AI 看到?
必须放在初始 HTML 响应里,不能靠前端框架的 portal 注入。Google 2025 年 12 月官方指南明确:JS 注入的 JSON-LD 可能被延迟处理,AI 爬虫完全看不到。检测方法:`curl https://yoursite.com/page | grep "application/ld+json"`——如果 grep 没命中,schema 就是 JS 注入的,需要改成 SSR 输出(参考国际 §5 讲过的 Next.js / Nuxt SSR 配置)。这点和国际 §5 的 SSR 检测是同一个根因——前端框架默认行为对 GEO 不友好。
sameAs 数组里我应该填多少个平台?
至少 5 个,最理想 10+ 个。sameAs 在 Schema 12 组件里满分 15(每个有效 sameAs 3 分,封顶 15)——意味着 5 个平台就能拿满分。但 5 个只是"满分门槛"——实际 AI 用 sameAs 做实体识别,平台越多识别越准确。优先级:Wikipedia > Wikidata > LinkedIn > YouTube > Twitter > Facebook > Crunchbase > GitHub > Google Scholar > ORCID > Instagram > 行业垂直目录。详见国际 §3 讲的 14 个推荐平台。
我做的是 SaaS 产品——Article schema 和 SoftwareApplication schema 都要做吗?
都做但用在不同页面。SoftwareApplication schema 用在你的产品页 / 主页(描述产品本身:定价 / 功能 / 评分);Article schema 用在你的博客 / 教程 / 行业洞察文章页(描述内容 + 作者 byline)。一个 SaaS 网站典型 schema 分布:主页 = Organization + WebSite + SearchAction;产品页 = SoftwareApplication;博客文章 = Article + Person(作者)+ Organization(publisher)。每页只放该页该有的 schema,不要把所有 schema 堆到首页。