1. 首页
  2. 资讯

IOSG:当你的浏览器成为代理

撰文:Mario Chow & Figo @IOSG

引言

过去 12 个月,网页浏览器与自动化的关系发生了剧烈变化。几乎所有大型科技公司都在争相构建自主的浏览器代理(browser agent)。从 2024 年底开始这一趋势愈发明显:OpenAI 在 1 月推出了 Agent 模式,Anthropic 为 Claude 模型发布了「电脑使用」功能,Google DeepMind 推出了 Project Mariner,Opera 宣布了代理型浏览器 Neon,而 Perplexity AI 则推出了 Comet 浏览器。信号十分明确:AI 的未来在于能够自主导航网页的代理。

这一趋势并不仅仅是给浏览器加上更聪明的聊天机器人,而是机器与数字环境交互方式的根本转变。浏览器代理是一类能够「看」网页并采取行动的 AI 系统:点击链接、填写表单、滚动页面、输入文字:就像人类用户一样。这种模式承诺将释放巨大的生产力和经济价值,因为它能自动化那些目前仍需要人工操作,或传统脚本过于复杂而无法完成的任务。

▲ GIF 演示:AI 浏览器代理的实际操作:遵循指令,导航到目标数据集页面,自动截图并提取所需数据。

谁将赢得 AI 浏览器之战?

几乎所有大型科技公司(以及一些初创公司)都在开发各自的浏览器 AI 代理方案。以下是最具代表性的几个项目:

OpenAI – Agent 模式

OpenAI 的 Agent 模式(前身名为 Operator,2025 年 1 月推出)是一种自带浏览器的 AI 代理。Operator 能够处理各种重复性的在线任务:例如填写网页表单、订购杂货、安排会议:全部通过人类常用的标准网页界面完成。

▲ AI 代理像专业助理一样安排会议:检查日历、寻找可用时间段、创建活动、发送确认,并为你生成.ics 文件。

Anthropic – Claude 的「Computer Use」

2024 年底,Anthropic 为 Claude 3.5 引入了全新的 「Computer Use(电脑使用)」 功能,赋予了其像人一样操作电脑和浏览器的能力。Claude 可以看屏幕、移动光标、点击按钮、输入文字。这是首个同类的大模型代理工具进入公开测试版,开发者可以让 Claude 自动导航网站和应用程序。Anthropic 将其定位为一种实验性功能,主要目标是实现网页上的多步骤工作流自动化。

Perplexity – Comet

AI 初创公司 Perplexity(以问答引擎闻名)在 2025 年中期推出了 Comet 浏览器,作为 Chrome 的 AI 驱动替代品。Comet 的核心是内置在地址栏(omnibox)中的对话式 AI 搜索引擎,能够提供即时问答和摘要,而不是传统的搜索链接。






免责声明:本站所有内容不构成投资建议,币市有风险、投资请慎重。
- 区块报

相关推荐