Claude 3.5 推出重大更新:AI 开始像人类一样操作电脑,掀起代理智能新浪潮
新一代 AI 不再局限于对话,开始真正理解和使用人类工具,从搜索引擎到日历应用都能自如操作

Claude 3.5 推出重大更新:AI 开始像人类一样操作电脑,掀起代理智能新浪潮
近日,Anthropic 公司为其大语言模型 Claude 推出了一项革命性的新功能「Computer Use」。这个朴实无华的名字背后,展现了 AI 在人机交互领域的重大突破:AI 开始能够像人类一样直接操作计算机了。
AI 开始真正"使用"电脑
通过 Computer Use 功能,Claude 现在可以执行一系列复杂的计算机操作任务。例如,当用户要求它规划一次观看日出的行程时,Claude 会自动:
- 打开浏览器搜索最佳观景点
- 使用地图应用计算路程和时间
- 查询日出时间
- 在日历中创建完整的行程安排
整个过程完全自动化,就像一个真实的助理在操作电脑一样。这种能力意味着 AI 不再仅仅是一个对话工具,而是开始真正理解和使用人类的工具。
技术能力与局限
根据 Anthropic 公布的评估数据,当前版本在 OSWorld 评估中得分为 14.9%,虽然远高于第二名的 7.7%,但与人类 75% 的水平仍有较大差距。这表明该技术仍处于初期阶段,还有很大的提升空间。
为了确保安全性,Anthropic 建议用户在使用这一功能时采用虚拟机或 Docker 环境,以防止潜在的系统风险。
AI 应用场景日益丰富
除了基础的电脑操作,AI 在各个领域的应用也在快速扩展:
1. 内容创作与可视化
- AI 已能够将复杂的文字材料转化为清晰的图表和思维导图
- 可以自动生成和编辑播客内容
- 能够进行智能化的视频剪辑和 Vlog 制作
2. 生产力工具
- 图像处理:从简单的图片编辑到复杂的海报设计
- 文档处理:自动整理和提取 PPT 照片中的信息
- 知识管理:智能归类和结构化处理各类信息
3. 离线智能
随着技术进步,小型化的 AI 模型也展现出惊人的能力。例如,仅有 2B 参数的 Gemma 2 模型就能在手机或平板上运行,处理速度达到每秒 39 个 tokens,展现出与 GPT-3.5 相当的智能水平。
未来展望
这些进展标志着我们正在进入一个 AI 代理推理的新时代。如同远程控制电脑一样,AI 展现出了某种「自主性」,不再只是被动回答问题,而是能够主动思考和行动。
专家预测,随着大模型的理解能力不断提升,未来 AI 可能会在更复杂的任务中展现出惊人的能力,如一句话生成完整的应用程序界面或整套 PPT 演示文稿。这种趋势预示着 AI 与人类协作方式的根本性变革正在到来。
值得注意的是,这种变革不仅体现在技术层面,更重要的是改变了人们使用 AI 的方式。正如专家所说,AI 不应该仅仅被视为效率工具,而应该被视为意义的放大器,帮助人类更好地实现创造性工作。