WebMCP 和标准 MCP 协议有什么区别？

标准 MCP 是服务端协议，需要单独部署 MCP Server；WebMCP 将 MCP 能力嵌入浏览器，让网页本身可以通过声明式方式暴露结构化数据给 AI Agent，无需额外后端

Modern Web Guidance 如何解决 AI 编码 Agent 的知识过时问题？

Google 维护一套专家验证的现代 Web 最佳实践库，AI 编码 Agent 可以在生成代码时实时查阅，确保使用最新的 Web API 和安全实践，而非依赖训练数据中的过时知识

信息代理和 Google Alerts 有什么区别？

Google Alerts 基于关键词匹配推送搜索结果；信息代理由 Gemini 3.5 Flash 驱动，能理解语义、持续监控多维度信息源，并以对话形式主动汇报总结，而非简单列出链接

WebMCP 的 Origin Trial 如何申请？

开发者需要访问 Chrome Origin Trials 页面注册 WebMCP 试用，获取 trial token 后在网页 HTML 中添加 meta 标签即可启用。目前要求 Chrome 149 及以上版本

这些功能对普通前端开发者有什么影响？

短期内影响有限，WebMCP 仍在试用阶段。但长期来看，前端开发者需要学习如何为 AI Agent 暴露页面数据，以及如何利用 Modern Web Guidance 确保 AI 生成的代码符合最佳实践

Google I/O 2026 Agentic Web 横评：WebMCP、Modern Web Guidance 与信息代理

Web 正式进入 Agent 时代

Google I/O 2026 一口气发布了 15 项 Chrome 更新，核心主题只有一个词：Agentic Web。从 WebMCP 到 Modern Web Guidance，再到 Auto Browse 和 Gemini in Chrome，Google 的意图很明确——让 AI Agent 成为 Web 的一等公民。

这不是概念预告。Expedia、Booking.com、Shopify、Instacart、Target、Etsy 等头部平台已经在测试 WebMCP 集成。Chrome 149 开放了 Origin Trial，开发者现在就可以动手。

本文聚焦 I/O 2026 的三个核心能力——WebMCP、Modern Web Guidance 和信息代理——逐一拆解技术细节，最后给出横向对比。

WebMCP：让网页变成 MCP Server

问题：Agent 操作网页太脆弱

当前 AI Agent 与网页交互的主流方式是 UI 自动化——模拟点击、填表、滚动。这种方式有三个致命缺陷：

脆弱：页面结构一变就挂
慢：需要渲染完整页面再定位元素
不精确：Agent 对页面语义理解有限，经常点错

WebMCP 的解法很直接：让网页主动声明自己能做什么，而不是让 Agent 去猜。

核心概念

WebMCP（Web Model Context Protocol）是一个提议中的开放 Web 标准，它让网页可以像 MCP Server 一样暴露结构化工具（Tools），AI Agent 直接调用这些工具完成任务，无需模拟用户操作。

关键特征：

浏览器原生：运行在浏览器 tab 中，不需要独立后端
用户可见：所有操作在浏览器 tab 内执行，用户全程可观察
Origin 隔离：仅 HTTPS 页面可用，跨域访问需要双向授权
敏感操作可确认：支持弹出对话框让用户确认

两种 API 风格

WebMCP 提供两套 API，覆盖不同场景：

命令式 API（Imperative）——用 JavaScript 注册工具：

// 注册一个商品搜索工具
document.modelContext.registerTool({
  name: "searchProducts",
  description: "根据关键词搜索商品目录",
  inputSchema: {
    type: "object",
    properties: {
      query: { type: "string" },
      category: {
        type: "string",
        enum: ["all", "clothing", "electronics", "books"]
      }
    },
    required: ["query"]
  },
  execute: async (input) => {
    const results = await productStore.search(input.query, input.category);
    return { products: results, total: results.length };
  },
  annotations: { readOnlyHint: true }
});

声明式 API（Declarative）——用 HTML 属性标注现有表单：

<form toolname="createSupportRequest"
      tooldescription="提交客户支持请求"
      toolautosubmit>
  <label for="team">问题类型</label>
  <select name="team" required
    toolparamdescription="决定请求被路由到哪个团队">
    <option value="happiness">退货退款</option>
    <option value="distribution">物流查询</option>
  </select>

  <label for="details">详细描述</label>
  <textarea name="details"
    toolparamdescription="问题的详细描述"></textarea>

  <button type="submit">提交</button>
</form>

声明式 API 的亮点是零代码改造——给现有表单加几个属性就能让 Agent 调用。浏览器会自动将表单结构转换为 JSON Schema。

命令式 API 详解

核心入口是 document.modelContext（注意：Chrome 150 已从 navigator.modelContext 迁移到 document.modelContext），提供三个核心方法：

方法	返回值	用途
`registerTool(toolDef, options?)`	void	注册工具
`getTools(options?)`	`Promise<Tool[]>`	发现可用工具
`executeTool(tool, jsonArgs, options?)`	`Promise<string>`	执行工具

一个更完整的例子——带用户确认的购物车操作：

document.modelContext.registerTool({
  name: "addToCart",
  description: "将商品添加到购物车",
  inputSchema: {
    type: "object",
    properties: {
      productId: { type: "string" },
      quantity: { type: "integer", minimum: 1 }
    },
    required: ["productId", "quantity"]
  },
  execute: async (input, client) => {
    // 敏感操作：弹出确认对话框
    const confirmed = await client.requestUserInteraction(async () => {
      return await showConfirmDialog(
        `确认添加 ${input.quantity} 件商品到购物车？`
      );
    });
    if (!confirmed) return { cancelled: true };
    await cart.add(input.productId, input.quantity);
    return { success: true, cartTotal: cart.total };
  }
});

requestUserInteraction 是安全设计的核心——Agent 执行到这里会暂停，等用户在浏览器中手动确认后才继续。

声明式 API 的 CSS 反馈

当 Agent 调用声明式工具时，浏览器提供两个 CSS 伪类用于视觉反馈：

/* Agent 正在操作表单时的高亮 */
form:tool-form-active {
  outline: light-dark(blue, cyan) dashed 2px;
  outline-offset: -1px;
}

/* Agent 即将提交时的按钮高亮 */
input:tool-submit-active {
  outline: light-dark(red, pink) dashed 2px;
  outline-offset: -1px;
}

这让用户能直观看到 Agent 当前在操作哪个表单。

Origin Trial 注册流程

访问 Chrome Origin Trials 页面，搜索 “WebMCP”
注册后获取 Trial Token
在页面中添加 meta 标签：

<meta http-equiv="origin-trial" content="YOUR_TRIAL_TOKEN">

需要 Chrome 149 及以上版本

本地开发可以直接开 Flag：访问 chrome://flags/#enable-webmcp-testing，设为 Enabled。

功能检测

if ('modelContext' in document) {
  // WebMCP 可用，注册工具
  document.modelContext.registerTool({ /* ... */ });
} else {
  // 回退到传统交互方式
}

Modern Web Guidance：给 AI 编码 Agent 装上”最佳实践大脑”

问题：AI 写的前端代码在用过时模式

AI 编码 Agent（Cursor、Copilot、Antigravity 等）的训练数据往往滞后 6-12 个月。它们会推荐已废弃的 API、使用旧的安全模式、忽略最新的浏览器兼容性数据。开发者接受了 AI 建议，却引入了技术债务。

解决方案

Modern Web Guidance 是 Google 维护的一套专家验证技能库（Skills Library），目前覆盖 100+ 用例，持续更新。它直接集成到 AI 编码 Agent 的上下文中，让 Agent 在生成代码时自动参考最新的 Web 平台最佳实践。

核心特性：

与 Baseline 集成：自动判断目标浏览器支持情况，选择正确的特性和 fallback
持续更新：不依赖模型训练数据的时效性
跨 Agent 通用：支持 Antigravity、Cursor、Copilot 等 20+ 编码 Agent

安装方式

三种安装途径：

# 方式 1：npx 一键安装（推荐）
npx modern-web-guidance

# 方式 2：Google Antigravity 中一键启用

# 方式 3：作为编码 Agent 扩展手动安装

安装后会在项目中生成一个 SKILL.md 文件，编码 Agent 在生成代码时会自动参考其中的规则。

覆盖范围

Modern Web Guidance 涵盖的领域包括但不限于：

性能：Core Web Vitals 优化、资源加载策略
可访问性：ARIA 模式、键盘导航、屏幕阅读器兼容
安全：CSP 策略、XSS 防护、安全头部配置
现代 API：View Transitions、Container Queries、Popover API 等
兼容性：基于 Baseline 数据的自动 fallback 选择

与传统文档的区别

维度	MDN / 官方文档	Modern Web Guidance
消费者	人类开发者	AI 编码 Agent
格式	长文档 + 示例	结构化技能规则
更新频率	不定期	持续同步浏览器更新
集成方式	开发者主动查阅	Agent 自动参考
兼容性判断	手动查 Can I Use	自动对接 Baseline

信息代理：24/7 的 Web 哨兵

从 Google Alerts 到语义级监控

Google I/O 2026 发布的 Auto Browse 功能中包含一个重要能力：信息代理（Information Agents）。它不是简单的关键词订阅，而是由 Gemini 3.5 Flash 驱动的持续性 Web 监控 Agent。

核心区别：

维度	Google Alerts	信息代理
触发方式	关键词匹配	语义理解
信息源	Google 搜索索引	全 Web 浏览 + 多源聚合
输出格式	链接列表邮件	对话式总结 + 洞察
运行环境	服务端批处理	Chrome 浏览器 + Gemini
持续性	定时触发	24/7 持续运行
智能程度	无推理能力	支持多步推理和信息综合

信息代理的典型场景：

监控竞品价格变动并给出分析
追踪某个开源项目的关键 Issue 进展
汇总某个技术领域的最新论文和讨论

它与 Gemini Spark（Google 新推出的 24/7 个人 AI Agent）深度集成，可以在桌面端的 Chrome 中持续运行，主动将发现推送给用户。

Generative UI 与 Soft Navigations

除了三大核心能力，I/O 2026 还有两个值得关注的更新：

Generative UI

AI 根据用户需求即时生成自定义工具和迷你应用。比如用户问”帮我对比这两款手机”，Gemini 不是给一段文本，而是直接生成一个交互式的对比表格组件。这是 Chrome 内置 AI 能力的自然延伸。

Soft Navigations API

终于来了。这个 API 将 Core Web Vitals（LCP、INP、CLS）的测量能力扩展到单页应用（SPA）。此前 SPA 的页面内导航无法被 CrUX 数据捕获，开发者只能依赖合成测试。Soft Navigations API 让 SPA 的性能数据首次可以出现在 Chrome 用户体验报告中。

这对 React / Vue / Angular 生态是重大利好——SPA 不再是性能测量的盲区。

横评：WebMCP vs 传统 API vs 标准 MCP

三种 Agent 与 Web 交互方式的全面对比：

维度	WebMCP	传统 REST API	标准 MCP Server
运行位置	浏览器 tab 内	独立后端服务器	独立进程 / 容器
部署需求	无需额外部署	需要服务端基础设施	需要部署 MCP Server
注册方式	JS/HTML 属性声明	API 文档 + SDK	工具定义文件
安全模型	Origin 隔离 + 用户确认	API Key / OAuth	依实现而定
用户可见性	完全可见	不可见（后端）	不可见
协议标准	W3C 草案	HTTP/REST	Anthropic MCP
适用场景	电商交互、表单填写	数据查询、批量操作	开发工具集成
改造成本	低（加属性/JS）	高（需设计 API）	中（需写 Server）
跨域支持	需双向授权	CORS 配置	N/A（本地进程）
离线能力	需要打开网页	可独立调用	可独立调用
成熟度	Origin Trial	生产就绪	生产就绪
生态支持	Chrome 149+	全平台	VS Code / Claude 等

什么时候用哪个？

WebMCP：适合已有 Web 应用、希望让 Agent 直接在页面上完成任务的场景。电商、SaaS 工具、内容平台是最佳候选
传统 API：适合需要高吞吐、批量操作、无需用户界面的场景
标准 MCP：适合开发工具链集成，如让 Claude Code 调用数据库、文件系统

三者不是替代关系，而是互补。一个电商网站可能同时暴露 WebMCP 工具（给浏览器 Agent 用）、REST API（给后端服务用）和 MCP Server（给开发者 IDE 用）。

对开发者的实际影响

短期（2026 Q3-Q4）

前端开发者：可以开始在测试环境中集成 WebMCP，为重要表单和交互流程添加工具声明。声明式 API 的改造成本极低——给 <form> 加几个属性就够了
全栈开发者：安装 Modern Web Guidance，让编码 Agent 自动使用最新 Web 标准
SEO/增长团队：关注 Soft Navigations API，SPA 终于可以获得准确的 Core Web Vitals 数据

中期（2027）

WebMCP 正式标准化：如果 W3C 流程顺利，WebMCP 可能在 2027 年成为正式标准
多浏览器支持：Firefox 和 Safari 是否跟进将决定 WebMCP 的命运
Agent 生态成熟：更多 AI Agent 会原生支持 WebMCP 工具发现和调用

需要警惕的风险

标准碎片化：WebMCP 目前是 Google 主导的提案，不是 W3C 正式标准。如果其他浏览器厂商不跟进，可能重蹈 AMP 覆辙
安全隐患：Agent 自动操作网页带来新的攻击面。恶意网站可能注册误导性工具描述来欺骗 Agent
用户体验降级：如果 Agent 操作过于频繁，可能干扰用户的正常浏览

总结

Google I/O 2026 的 Agentic Web 不是 PPT 工程——WebMCP 已经开放 Origin Trial，Expedia 等大厂已在测试，Modern Web Guidance 的 GitHub 仓库已经可用。

三个能力分别解决了三个层次的问题：

WebMCP：解决 Agent 与网页的交互问题（从”猜”变成”问”）
Modern Web Guidance：解决 AI 编码 Agent 的知识过时问题
信息代理：解决信息监控从”关键词匹配”到”语义理解”的升级

对前端开发者来说，最实际的行动是：

在 Chrome 149 上试用 WebMCP，给核心业务表单加上声明式标注
安装 Modern Web Guidance，提升 AI 辅助编码的质量
持续关注 Soft Navigations API，为 SPA 性能优化做准备

Web 从来不是静态的。从文档到应用，从应用到平台，现在又从平台到 Agent 运行时。变化已经开始，代码就是入场券。