Tools

Google I/O 2026 Agentic Web 横评:WebMCP、Modern Web Guidance 与信息代理

8 min read ·

Web 正式进入 Agent 时代

Google I/O 2026 一口气发布了 15 项 Chrome 更新,核心主题只有一个词:Agentic Web。从 WebMCP 到 Modern Web Guidance,再到 Auto Browse 和 Gemini in Chrome,Google 的意图很明确——让 AI Agent 成为 Web 的一等公民。

这不是概念预告。Expedia、Booking.com、Shopify、Instacart、Target、Etsy 等头部平台已经在测试 WebMCP 集成。Chrome 149 开放了 Origin Trial,开发者现在就可以动手。

本文聚焦 I/O 2026 的三个核心能力——WebMCP、Modern Web Guidance 和信息代理——逐一拆解技术细节,最后给出横向对比。

WebMCP:让网页变成 MCP Server

问题:Agent 操作网页太脆弱

当前 AI Agent 与网页交互的主流方式是 UI 自动化——模拟点击、填表、滚动。这种方式有三个致命缺陷:

  1. 脆弱:页面结构一变就挂
  2. :需要渲染完整页面再定位元素
  3. 不精确:Agent 对页面语义理解有限,经常点错

WebMCP 的解法很直接:让网页主动声明自己能做什么,而不是让 Agent 去猜。

核心概念

WebMCP(Web Model Context Protocol)是一个提议中的开放 Web 标准,它让网页可以像 MCP Server 一样暴露结构化工具(Tools),AI Agent 直接调用这些工具完成任务,无需模拟用户操作。

关键特征:

两种 API 风格

WebMCP 提供两套 API,覆盖不同场景:

命令式 API(Imperative)——用 JavaScript 注册工具:

// 注册一个商品搜索工具
document.modelContext.registerTool({
  name: "searchProducts",
  description: "根据关键词搜索商品目录",
  inputSchema: {
    type: "object",
    properties: {
      query: { type: "string" },
      category: {
        type: "string",
        enum: ["all", "clothing", "electronics", "books"]
      }
    },
    required: ["query"]
  },
  execute: async (input) => {
    const results = await productStore.search(input.query, input.category);
    return { products: results, total: results.length };
  },
  annotations: { readOnlyHint: true }
});

声明式 API(Declarative)——用 HTML 属性标注现有表单:

<form toolname="createSupportRequest"
      tooldescription="提交客户支持请求"
      toolautosubmit>
  <label for="team">问题类型</label>
  <select name="team" required
    toolparamdescription="决定请求被路由到哪个团队">
    <option value="happiness">退货退款</option>
    <option value="distribution">物流查询</option>
  </select>

  <label for="details">详细描述</label>
  <textarea name="details"
    toolparamdescription="问题的详细描述"></textarea>

  <button type="submit">提交</button>
</form>

声明式 API 的亮点是零代码改造——给现有表单加几个属性就能让 Agent 调用。浏览器会自动将表单结构转换为 JSON Schema。

命令式 API 详解

核心入口是 document.modelContext(注意:Chrome 150 已从 navigator.modelContext 迁移到 document.modelContext),提供三个核心方法:

方法返回值用途
registerTool(toolDef, options?)void注册工具
getTools(options?)Promise&lt;Tool[]&gt;发现可用工具
executeTool(tool, jsonArgs, options?)Promise&lt;string&gt;执行工具

一个更完整的例子——带用户确认的购物车操作:

document.modelContext.registerTool({
  name: "addToCart",
  description: "将商品添加到购物车",
  inputSchema: {
    type: "object",
    properties: {
      productId: { type: "string" },
      quantity: { type: "integer", minimum: 1 }
    },
    required: ["productId", "quantity"]
  },
  execute: async (input, client) => {
    // 敏感操作:弹出确认对话框
    const confirmed = await client.requestUserInteraction(async () => {
      return await showConfirmDialog(
        `确认添加 ${input.quantity} 件商品到购物车?`
      );
    });
    if (!confirmed) return { cancelled: true };
    await cart.add(input.productId, input.quantity);
    return { success: true, cartTotal: cart.total };
  }
});

requestUserInteraction 是安全设计的核心——Agent 执行到这里会暂停,等用户在浏览器中手动确认后才继续。

声明式 API 的 CSS 反馈

当 Agent 调用声明式工具时,浏览器提供两个 CSS 伪类用于视觉反馈:

/* Agent 正在操作表单时的高亮 */
form:tool-form-active {
  outline: light-dark(blue, cyan) dashed 2px;
  outline-offset: -1px;
}

/* Agent 即将提交时的按钮高亮 */
input:tool-submit-active {
  outline: light-dark(red, pink) dashed 2px;
  outline-offset: -1px;
}

这让用户能直观看到 Agent 当前在操作哪个表单。

Origin Trial 注册流程

  1. 访问 Chrome Origin Trials 页面,搜索 “WebMCP”
  2. 注册后获取 Trial Token
  3. 在页面中添加 meta 标签:
<meta http-equiv="origin-trial" content="YOUR_TRIAL_TOKEN">
  1. 需要 Chrome 149 及以上版本

本地开发可以直接开 Flag:访问 chrome://flags/#enable-webmcp-testing,设为 Enabled。

功能检测

if ('modelContext' in document) {
  // WebMCP 可用,注册工具
  document.modelContext.registerTool({ /* ... */ });
} else {
  // 回退到传统交互方式
}

Modern Web Guidance:给 AI 编码 Agent 装上”最佳实践大脑”

问题:AI 写的前端代码在用过时模式

AI 编码 Agent(Cursor、Copilot、Antigravity 等)的训练数据往往滞后 6-12 个月。它们会推荐已废弃的 API、使用旧的安全模式、忽略最新的浏览器兼容性数据。开发者接受了 AI 建议,却引入了技术债务。

解决方案

Modern Web Guidance 是 Google 维护的一套专家验证技能库(Skills Library),目前覆盖 100+ 用例,持续更新。它直接集成到 AI 编码 Agent 的上下文中,让 Agent 在生成代码时自动参考最新的 Web 平台最佳实践。

核心特性:

安装方式

三种安装途径:

# 方式 1:npx 一键安装(推荐)
npx modern-web-guidance

# 方式 2:Google Antigravity 中一键启用

# 方式 3:作为编码 Agent 扩展手动安装

安装后会在项目中生成一个 SKILL.md 文件,编码 Agent 在生成代码时会自动参考其中的规则。

覆盖范围

Modern Web Guidance 涵盖的领域包括但不限于:

与传统文档的区别

维度MDN / 官方文档Modern Web Guidance
消费者人类开发者AI 编码 Agent
格式长文档 + 示例结构化技能规则
更新频率不定期持续同步浏览器更新
集成方式开发者主动查阅Agent 自动参考
兼容性判断手动查 Can I Use自动对接 Baseline

信息代理:24/7 的 Web 哨兵

从 Google Alerts 到语义级监控

Google I/O 2026 发布的 Auto Browse 功能中包含一个重要能力:信息代理(Information Agents)。它不是简单的关键词订阅,而是由 Gemini 3.5 Flash 驱动的持续性 Web 监控 Agent。

核心区别:

维度Google Alerts信息代理
触发方式关键词匹配语义理解
信息源Google 搜索索引全 Web 浏览 + 多源聚合
输出格式链接列表邮件对话式总结 + 洞察
运行环境服务端批处理Chrome 浏览器 + Gemini
持续性定时触发24/7 持续运行
智能程度无推理能力支持多步推理和信息综合

信息代理的典型场景:

它与 Gemini Spark(Google 新推出的 24/7 个人 AI Agent)深度集成,可以在桌面端的 Chrome 中持续运行,主动将发现推送给用户。

Generative UI 与 Soft Navigations

除了三大核心能力,I/O 2026 还有两个值得关注的更新:

Generative UI

AI 根据用户需求即时生成自定义工具和迷你应用。比如用户问”帮我对比这两款手机”,Gemini 不是给一段文本,而是直接生成一个交互式的对比表格组件。这是 Chrome 内置 AI 能力的自然延伸。

Soft Navigations API

终于来了。这个 API 将 Core Web Vitals(LCP、INP、CLS)的测量能力扩展到单页应用(SPA)。此前 SPA 的页面内导航无法被 CrUX 数据捕获,开发者只能依赖合成测试。Soft Navigations API 让 SPA 的性能数据首次可以出现在 Chrome 用户体验报告中。

这对 React / Vue / Angular 生态是重大利好——SPA 不再是性能测量的盲区。

横评:WebMCP vs 传统 API vs 标准 MCP

三种 Agent 与 Web 交互方式的全面对比:

维度WebMCP传统 REST API标准 MCP Server
运行位置浏览器 tab 内独立后端服务器独立进程 / 容器
部署需求无需额外部署需要服务端基础设施需要部署 MCP Server
注册方式JS/HTML 属性声明API 文档 + SDK工具定义文件
安全模型Origin 隔离 + 用户确认API Key / OAuth依实现而定
用户可见性完全可见不可见(后端)不可见
协议标准W3C 草案HTTP/RESTAnthropic MCP
适用场景电商交互、表单填写数据查询、批量操作开发工具集成
改造成本低(加属性/JS)高(需设计 API)中(需写 Server)
跨域支持需双向授权CORS 配置N/A(本地进程)
离线能力需要打开网页可独立调用可独立调用
成熟度Origin Trial生产就绪生产就绪
生态支持Chrome 149+全平台VS Code / Claude 等

什么时候用哪个?

三者不是替代关系,而是互补。一个电商网站可能同时暴露 WebMCP 工具(给浏览器 Agent 用)、REST API(给后端服务用)和 MCP Server(给开发者 IDE 用)。

对开发者的实际影响

短期(2026 Q3-Q4)

  1. 前端开发者:可以开始在测试环境中集成 WebMCP,为重要表单和交互流程添加工具声明。声明式 API 的改造成本极低——给 &lt;form&gt; 加几个属性就够了
  2. 全栈开发者:安装 Modern Web Guidance,让编码 Agent 自动使用最新 Web 标准
  3. SEO/增长团队:关注 Soft Navigations API,SPA 终于可以获得准确的 Core Web Vitals 数据

中期(2027)

  1. WebMCP 正式标准化:如果 W3C 流程顺利,WebMCP 可能在 2027 年成为正式标准
  2. 多浏览器支持:Firefox 和 Safari 是否跟进将决定 WebMCP 的命运
  3. Agent 生态成熟:更多 AI Agent 会原生支持 WebMCP 工具发现和调用

需要警惕的风险

总结

Google I/O 2026 的 Agentic Web 不是 PPT 工程——WebMCP 已经开放 Origin Trial,Expedia 等大厂已在测试,Modern Web Guidance 的 GitHub 仓库已经可用。

三个能力分别解决了三个层次的问题:

对前端开发者来说,最实际的行动是:

  1. 在 Chrome 149 上试用 WebMCP,给核心业务表单加上声明式标注
  2. 安装 Modern Web Guidance,提升 AI 辅助编码的质量
  3. 持续关注 Soft Navigations API,为 SPA 性能优化做准备

Web 从来不是静态的。从文档到应用,从应用到平台,现在又从平台到 Agent 运行时。变化已经开始,代码就是入场券。

Frequently asked questions

WebMCP 和标准 MCP 协议有什么区别?
标准 MCP 是服务端协议,需要单独部署 MCP Server;WebMCP 将 MCP 能力嵌入浏览器,让网页本身可以通过声明式方式暴露结构化数据给 AI Agent,无需额外后端
Modern Web Guidance 如何解决 AI 编码 Agent 的知识过时问题?
Google 维护一套专家验证的现代 Web 最佳实践库,AI 编码 Agent 可以在生成代码时实时查阅,确保使用最新的 Web API 和安全实践,而非依赖训练数据中的过时知识
信息代理和 Google Alerts 有什么区别?
Google Alerts 基于关键词匹配推送搜索结果;信息代理由 Gemini 3.5 Flash 驱动,能理解语义、持续监控多维度信息源,并以对话形式主动汇报总结,而非简单列出链接
WebMCP 的 Origin Trial 如何申请?
开发者需要访问 Chrome Origin Trials 页面注册 WebMCP 试用,获取 trial token 后在网页 HTML 中添加 meta 标签即可启用。目前要求 Chrome 149 及以上版本
这些功能对普通前端开发者有什么影响?
短期内影响有限,WebMCP 仍在试用阶段。但长期来看,前端开发者需要学习如何为 AI Agent 暴露页面数据,以及如何利用 Modern Web Guidance 确保 AI 生成的代码符合最佳实践
// next.txt ›

Some outbound links in this post are affiliate links — see disclosure.