AI代理

OpenAI推出AI Agent评测基准PaperBench

OpenAI 团队推出了一个名为 PaperBench 的基准测试,旨在评估AI代理在复制先进 AI 研究方面的能力。该测试要求 AI 代理从头开始复制20篇2024年国际机器学习会议(ICML)中的重点和口头论文,整个过程涉及理解论文贡献、开发代码库以及成功执行实验。为确保评估的客观性,研究人员设计了详细的评分标准。这些标准将每项复制任务分解为多个层级的子任务,并设定明确的评分标准。PaperB

密码管理公司1Password 推出新功能,助力 AI 代理安全管理企业凭证

随着人工智能(AI)逐渐接管传统上由人类负责的商业流程,许多 AI 代理将需要安全地登录多个系统,以完成它们的任务。为了解决企业在现代凭证管理中面临的挑战,知名密码管理公司1Password 宣布,已在其扩展访问管理平台(XAM)上新增了 AI 代理安全功能。图源备注:图片由AI生成,图片授权服务商Midjourney近年来,AI 技术的迅猛发展引发了人们对于未来就业市场的讨论。比尔・盖茨最近预测

阿里巴巴已宣布全面支持MCP协议 腾讯紧随其后

近日,中国人工智能领域迎来了一场技术标准的悄然变革——Model Context Protocol(MCP)正以迅猛之势成为国内AI生态的事实标准。据业内最新动态,阿里巴巴已宣布全面支持MCP协议,而腾讯也紧随其后加入这一阵营。与此同时,部分平台如Coze因反应迟缓而备受关注。这一趋势不仅凸显了MCP在AI代理开发中的核心地位,也预示着中国科技巨头在全球AI标准竞争中的新一轮角力。MCP作为一种新

OpenAI CFO称正在开发AI代理“A-SWE ”以替换软件工程师

在最近的高盛会议上,OpenAI 首席财务官莎拉・弗莱尔(Sarah Friar)透露,该公司正在开发一种名为 “A-SWE” 的人工智能(AI)代理,旨在全面取代软件工程师的工作。弗莱尔表示,这一新型 AI 不仅能增强现有工程师的工作效率,更能独立完成从应用程序开发到质量保证、故障排除和文档编写等多项任务。她指出,A-SWE 将使企业的开发团队 “倍增”。图源备注:图片由AI生成,图片授权服务商

PokemonGym:AI玩宝可梦Red,Claude仅用450步征服

在人工智能领域不断突破的今天,一个名为 PokemonGym 的创新项目正悄然兴起,引起了游戏爱好者和AI研究者的广泛关注。PokemonGym 是一套专门为评估人工智能(AI)代理在经典游戏《宝可梦Red》中表现的服务平台。通过构建一套完善的服务器-客户端架构,PokemonGym 使得开发者可以训练和测试各种AI算法在虚拟的游戏世界中自主行动。PokemonGym的核心功能:让AI自主探索宝可

微软 CTO:产品经理在 AI 培训中发挥重要作用

微软的首席技术官凯文・斯科特(Kevin Scott)强调了产品经理在训练 AI 代理方面的重要性。根据他的说法,产品经理不仅是产品设计和开发的核心,还在创建 “反馈循环” 中发挥着至关重要的角色。这些反馈循环可以帮助 AI 代理不断学习和改进其执行任务的能力,从而更好地满足用户需求。凯文・斯科特指出,AI 系统的有效性在很大程度上依赖于人类的反馈。产品经理通过收集用户的反馈意见,并将这些信息传递

​谷歌AI发布601个真实世界的生成式AI应用案例,涵盖各行业

谷歌云近期发布了一份令人瞩目的报告,展示了601个来自全球顶尖企业的真实世界生成式 AI(GenAI)应用案例。这一数字比去年在谷歌云大会上分享的101个案例增长了六倍,展现了生成式 AI 技术从原型走向生产应用的飞速进展,这些技术正在几乎所有行业中推动变革。在2025年谷歌云大会上宣布的这份报告涵盖了从优步、三星、花旗到梅赛德斯 - 奔驰、德意志银行和阿拉斯加航空等多家知名公司的应用。这些案例强

Cloudflare 发布 Node.js 生态 Agents 开发包,助力 AI 代理开发

近日,Cloudflare 推出了一款面向 Node.js 生态的 Agents 开发包,为开发者提供了一套完整的 AI 代理开发基础设施。这一开发包集成了多项核心功能,包括工作流引擎、工具集成框架、多代理协作平台(MCP)以及状态持久化支持,旨在简化 AI 代理的构建与部署流程。据介绍,该开发包能够帮助开发者轻松实现自动化任务执行、多工具协同以及动态适应上下文的能力。Cloudflare 官网还

亚马逊推出Nova Act:进军AI代理市场的新举措

亚马逊周一发布了Nova Act,这是一款能够控制网络浏览器并独立执行简单操作的通用AI代理。同时推出的还有Nova Act SDK,允许开发人员使用Nova Act构建代理原型。Nova Act由亚马逊在旧金山新设立的AGI实验室开发,这也将为该公司即将推出的Alexa+(亚马逊语音助手的生成式AI增强版)提供关键功能。不过目前发布的Nova Act版本被定位为"研究预览版",开发人员可通过no

Dataiku 推出新功能,助力企业高效管理 AI 代理

在人工智能技术快速发展的背景下,AI 平台公司 Dataiku 于2025年4月24日在纽约宣布推出全新的 AI 代理功能。这个新功能旨帮助企业以更高效的方式创建和管理 AI 代理,从而推动 AI 应用的全面落地。Dataiku 指出,现有客户中已有超过20% 的人开始在业务和数据流程中集成生成式 AI,许多客户的项目活跃案例超过了1000个。随着企业迅速部署 AI 代理,面临着无序架构的问题,代