Web 正式进入 Agent 时代
Google I/O 2026 一口气发布了 15 项 Chrome 更新,核心主题只有一个词:Agentic Web。从 WebMCP 到 Modern Web Guidance,再到 Auto Browse 和 Gemini in Chrome,Google 的意图很明确——让 AI Agent 成为 Web 的一等公民。
这不是概念预告。Expedia、Booking.com、Shopify、Instacart、Target、Etsy 等头部平台已经在测试 WebMCP 集成。Chrome 149 开放了 Origin Trial,开发者现在就可以动手。
本文聚焦 I/O 2026 的三个核心能力——WebMCP、Modern Web Guidance 和信息代理——逐一拆解技术细节,最后给出横向对比。
WebMCP:让网页变成 MCP Server
问题:Agent 操作网页太脆弱
当前 AI Agent 与网页交互的主流方式是 UI 自动化——模拟点击、填表、滚动。这种方式有三个致命缺陷:
- 脆弱:页面结构一变就挂
- 慢:需要渲染完整页面再定位元素
- 不精确:Agent 对页面语义理解有限,经常点错
WebMCP 的解法很直接:让网页主动声明自己能做什么,而不是让 Agent 去猜。
核心概念
WebMCP(Web Model Context Protocol)是一个提议中的开放 Web 标准,它让网页可以像 MCP Server 一样暴露结构化工具(Tools),AI Agent 直接调用这些工具完成任务,无需模拟用户操作。
关键特征:
- 浏览器原生:运行在浏览器 tab 中,不需要独立后端
- 用户可见:所有操作在浏览器 tab 内执行,用户全程可观察
- Origin 隔离:仅 HTTPS 页面可用,跨域访问需要双向授权
- 敏感操作可确认:支持弹出对话框让用户确认
两种 API 风格
WebMCP 提供两套 API,覆盖不同场景:
命令式 API(Imperative)——用 JavaScript 注册工具:
// 注册一个商品搜索工具
document.modelContext.registerTool({
name: "searchProducts",
description: "根据关键词搜索商品目录",
inputSchema: {
type: "object",
properties: {
query: { type: "string" },
category: {
type: "string",
enum: ["all", "clothing", "electronics", "books"]
}
},
required: ["query"]
},
execute: async (input) => {
const results = await productStore.search(input.query, input.category);
return { products: results, total: results.length };
},
annotations: { readOnlyHint: true }
});
声明式 API(Declarative)——用 HTML 属性标注现有表单:
<form toolname="createSupportRequest"
tooldescription="提交客户支持请求"
toolautosubmit>
<label for="team">问题类型</label>
<select name="team" required
toolparamdescription="决定请求被路由到哪个团队">
<option value="happiness">退货退款</option>
<option value="distribution">物流查询</option>
</select>
<label for="details">详细描述</label>
<textarea name="details"
toolparamdescription="问题的详细描述"></textarea>
<button type="submit">提交</button>
</form>
声明式 API 的亮点是零代码改造——给现有表单加几个属性就能让 Agent 调用。浏览器会自动将表单结构转换为 JSON Schema。
命令式 API 详解
核心入口是 document.modelContext(注意:Chrome 150 已从 navigator.modelContext 迁移到 document.modelContext),提供三个核心方法:
| 方法 | 返回值 | 用途 |
|---|---|---|
registerTool(toolDef, options?) | void | 注册工具 |
getTools(options?) | Promise<Tool[]> | 发现可用工具 |
executeTool(tool, jsonArgs, options?) | Promise<string> | 执行工具 |
一个更完整的例子——带用户确认的购物车操作:
document.modelContext.registerTool({
name: "addToCart",
description: "将商品添加到购物车",
inputSchema: {
type: "object",
properties: {
productId: { type: "string" },
quantity: { type: "integer", minimum: 1 }
},
required: ["productId", "quantity"]
},
execute: async (input, client) => {
// 敏感操作:弹出确认对话框
const confirmed = await client.requestUserInteraction(async () => {
return await showConfirmDialog(
`确认添加 ${input.quantity} 件商品到购物车?`
);
});
if (!confirmed) return { cancelled: true };
await cart.add(input.productId, input.quantity);
return { success: true, cartTotal: cart.total };
}
});
requestUserInteraction 是安全设计的核心——Agent 执行到这里会暂停,等用户在浏览器中手动确认后才继续。
声明式 API 的 CSS 反馈
当 Agent 调用声明式工具时,浏览器提供两个 CSS 伪类用于视觉反馈:
/* Agent 正在操作表单时的高亮 */
form:tool-form-active {
outline: light-dark(blue, cyan) dashed 2px;
outline-offset: -1px;
}
/* Agent 即将提交时的按钮高亮 */
input:tool-submit-active {
outline: light-dark(red, pink) dashed 2px;
outline-offset: -1px;
}
这让用户能直观看到 Agent 当前在操作哪个表单。
Origin Trial 注册流程
- 访问 Chrome Origin Trials 页面,搜索 “WebMCP”
- 注册后获取 Trial Token
- 在页面中添加 meta 标签:
<meta http-equiv="origin-trial" content="YOUR_TRIAL_TOKEN">
- 需要 Chrome 149 及以上版本
本地开发可以直接开 Flag:访问 chrome://flags/#enable-webmcp-testing,设为 Enabled。
功能检测
if ('modelContext' in document) {
// WebMCP 可用,注册工具
document.modelContext.registerTool({ /* ... */ });
} else {
// 回退到传统交互方式
}
Modern Web Guidance:给 AI 编码 Agent 装上”最佳实践大脑”
问题:AI 写的前端代码在用过时模式
AI 编码 Agent(Cursor、Copilot、Antigravity 等)的训练数据往往滞后 6-12 个月。它们会推荐已废弃的 API、使用旧的安全模式、忽略最新的浏览器兼容性数据。开发者接受了 AI 建议,却引入了技术债务。
解决方案
Modern Web Guidance 是 Google 维护的一套专家验证技能库(Skills Library),目前覆盖 100+ 用例,持续更新。它直接集成到 AI 编码 Agent 的上下文中,让 Agent 在生成代码时自动参考最新的 Web 平台最佳实践。
核心特性:
- 与 Baseline 集成:自动判断目标浏览器支持情况,选择正确的特性和 fallback
- 持续更新:不依赖模型训练数据的时效性
- 跨 Agent 通用:支持 Antigravity、Cursor、Copilot 等 20+ 编码 Agent
安装方式
三种安装途径:
# 方式 1:npx 一键安装(推荐)
npx modern-web-guidance
# 方式 2:Google Antigravity 中一键启用
# 方式 3:作为编码 Agent 扩展手动安装
安装后会在项目中生成一个 SKILL.md 文件,编码 Agent 在生成代码时会自动参考其中的规则。
覆盖范围
Modern Web Guidance 涵盖的领域包括但不限于:
- 性能:Core Web Vitals 优化、资源加载策略
- 可访问性:ARIA 模式、键盘导航、屏幕阅读器兼容
- 安全:CSP 策略、XSS 防护、安全头部配置
- 现代 API:View Transitions、Container Queries、Popover API 等
- 兼容性:基于 Baseline 数据的自动 fallback 选择
与传统文档的区别
| 维度 | MDN / 官方文档 | Modern Web Guidance |
|---|---|---|
| 消费者 | 人类开发者 | AI 编码 Agent |
| 格式 | 长文档 + 示例 | 结构化技能规则 |
| 更新频率 | 不定期 | 持续同步浏览器更新 |
| 集成方式 | 开发者主动查阅 | Agent 自动参考 |
| 兼容性判断 | 手动查 Can I Use | 自动对接 Baseline |
信息代理:24/7 的 Web 哨兵
从 Google Alerts 到语义级监控
Google I/O 2026 发布的 Auto Browse 功能中包含一个重要能力:信息代理(Information Agents)。它不是简单的关键词订阅,而是由 Gemini 3.5 Flash 驱动的持续性 Web 监控 Agent。
核心区别:
| 维度 | Google Alerts | 信息代理 |
|---|---|---|
| 触发方式 | 关键词匹配 | 语义理解 |
| 信息源 | Google 搜索索引 | 全 Web 浏览 + 多源聚合 |
| 输出格式 | 链接列表邮件 | 对话式总结 + 洞察 |
| 运行环境 | 服务端批处理 | Chrome 浏览器 + Gemini |
| 持续性 | 定时触发 | 24/7 持续运行 |
| 智能程度 | 无推理能力 | 支持多步推理和信息综合 |
信息代理的典型场景:
- 监控竞品价格变动并给出分析
- 追踪某个开源项目的关键 Issue 进展
- 汇总某个技术领域的最新论文和讨论
它与 Gemini Spark(Google 新推出的 24/7 个人 AI Agent)深度集成,可以在桌面端的 Chrome 中持续运行,主动将发现推送给用户。
Generative UI 与 Soft Navigations
除了三大核心能力,I/O 2026 还有两个值得关注的更新:
Generative UI
AI 根据用户需求即时生成自定义工具和迷你应用。比如用户问”帮我对比这两款手机”,Gemini 不是给一段文本,而是直接生成一个交互式的对比表格组件。这是 Chrome 内置 AI 能力的自然延伸。
Soft Navigations API
终于来了。这个 API 将 Core Web Vitals(LCP、INP、CLS)的测量能力扩展到单页应用(SPA)。此前 SPA 的页面内导航无法被 CrUX 数据捕获,开发者只能依赖合成测试。Soft Navigations API 让 SPA 的性能数据首次可以出现在 Chrome 用户体验报告中。
这对 React / Vue / Angular 生态是重大利好——SPA 不再是性能测量的盲区。
横评:WebMCP vs 传统 API vs 标准 MCP
三种 Agent 与 Web 交互方式的全面对比:
| 维度 | WebMCP | 传统 REST API | 标准 MCP Server |
|---|---|---|---|
| 运行位置 | 浏览器 tab 内 | 独立后端服务器 | 独立进程 / 容器 |
| 部署需求 | 无需额外部署 | 需要服务端基础设施 | 需要部署 MCP Server |
| 注册方式 | JS/HTML 属性声明 | API 文档 + SDK | 工具定义文件 |
| 安全模型 | Origin 隔离 + 用户确认 | API Key / OAuth | 依实现而定 |
| 用户可见性 | 完全可见 | 不可见(后端) | 不可见 |
| 协议标准 | W3C 草案 | HTTP/REST | Anthropic MCP |
| 适用场景 | 电商交互、表单填写 | 数据查询、批量操作 | 开发工具集成 |
| 改造成本 | 低(加属性/JS) | 高(需设计 API) | 中(需写 Server) |
| 跨域支持 | 需双向授权 | CORS 配置 | N/A(本地进程) |
| 离线能力 | 需要打开网页 | 可独立调用 | 可独立调用 |
| 成熟度 | Origin Trial | 生产就绪 | 生产就绪 |
| 生态支持 | Chrome 149+ | 全平台 | VS Code / Claude 等 |
什么时候用哪个?
- WebMCP:适合已有 Web 应用、希望让 Agent 直接在页面上完成任务的场景。电商、SaaS 工具、内容平台是最佳候选
- 传统 API:适合需要高吞吐、批量操作、无需用户界面的场景
- 标准 MCP:适合开发工具链集成,如让 Claude Code 调用数据库、文件系统
三者不是替代关系,而是互补。一个电商网站可能同时暴露 WebMCP 工具(给浏览器 Agent 用)、REST API(给后端服务用)和 MCP Server(给开发者 IDE 用)。
对开发者的实际影响
短期(2026 Q3-Q4)
- 前端开发者:可以开始在测试环境中集成 WebMCP,为重要表单和交互流程添加工具声明。声明式 API 的改造成本极低——给
<form>加几个属性就够了 - 全栈开发者:安装 Modern Web Guidance,让编码 Agent 自动使用最新 Web 标准
- SEO/增长团队:关注 Soft Navigations API,SPA 终于可以获得准确的 Core Web Vitals 数据
中期(2027)
- WebMCP 正式标准化:如果 W3C 流程顺利,WebMCP 可能在 2027 年成为正式标准
- 多浏览器支持:Firefox 和 Safari 是否跟进将决定 WebMCP 的命运
- Agent 生态成熟:更多 AI Agent 会原生支持 WebMCP 工具发现和调用
需要警惕的风险
- 标准碎片化:WebMCP 目前是 Google 主导的提案,不是 W3C 正式标准。如果其他浏览器厂商不跟进,可能重蹈 AMP 覆辙
- 安全隐患:Agent 自动操作网页带来新的攻击面。恶意网站可能注册误导性工具描述来欺骗 Agent
- 用户体验降级:如果 Agent 操作过于频繁,可能干扰用户的正常浏览
总结
Google I/O 2026 的 Agentic Web 不是 PPT 工程——WebMCP 已经开放 Origin Trial,Expedia 等大厂已在测试,Modern Web Guidance 的 GitHub 仓库已经可用。
三个能力分别解决了三个层次的问题:
- WebMCP:解决 Agent 与网页的交互问题(从”猜”变成”问”)
- Modern Web Guidance:解决 AI 编码 Agent 的知识过时问题
- 信息代理:解决信息监控从”关键词匹配”到”语义理解”的升级
对前端开发者来说,最实际的行动是:
- 在 Chrome 149 上试用 WebMCP,给核心业务表单加上声明式标注
- 安装 Modern Web Guidance,提升 AI 辅助编码的质量
- 持续关注 Soft Navigations API,为 SPA 性能优化做准备
Web 从来不是静态的。从文档到应用,从应用到平台,现在又从平台到 Agent 运行时。变化已经开始,代码就是入场券。