OpenAI

OpenAI开源BrowseComp,衡量 AI 代理浏览网页能力的新基准

人工智能领域的测试标杆再添新成员!OpenAI宣布开源BrowseComp,一个专为评估AI代理网络浏览能力设计的创新基准测试。这一举措不仅为AI研究社区提供了全新的工具,也为推动更智能、更可靠的浏览代理奠定了基础。AIbase为您深入解读BrowseComp的核心价值与行业影响。BrowseComp:AI浏览能力的“终极试炼”BrowseComp,全称“Browsing Competition”

Tinder推出AI语音调情游戏"Game Game",与OpenAI合作引发争议

Tinder近日宣布与OpenAI合作,推出了一款名为"Game Game"的AI语音调情游戏。该游戏利用OpenAI的语音模式和GPT-4o推理模型,鼓励用户在各种假设的邂逅场景中进行角色扮演,并根据调情水平获得积分。公司特别强调,游戏中收集的语音数据不会用于训练任何新的AI模型。最近被任命为Tinder母公司Match Group首席执行官的Zillow联合创始人Spencer Rascoff

效仿 OpenAI,谷歌 Gemini 加入 MCP 阵营,加速 AI 代理互联互通

就在 OpenAI 宣布采纳竞争对手 Anthropic 的标准,以实现人工智能模型与数据所在系统连接的几周后,谷歌也采取了类似举措。谷歌 DeepMind 首席执行官 Demis Hassabis 周三在社交平台 X 上发文宣布,谷歌将在其 Gemini 模型和软件开发工具包 (SDK) 中增加对 Anthropic 模型上下文协议 (MCP) 的支持。但他并未透露具体的时间表。Hassabis

离开OpenAI后,苏茨克维搞了个SSI,估值已达 320 亿美元

站长之家(ChinaZ.com) 4月14日 消息:在又一次筹集到 20 亿美元的资金后,由 OpenAI 联合创始人伊尔亚·苏茨克维(Ilya Sutskever)共同创立的 AI 初创公司Safe Superintelligence(以下简称 SSI)的估值达到了惊人的 320 亿美元。据悉,比较新一轮融资由绿橡树资本(Greenoaks)领投,科技巨头谷歌母公司 Alphabet 、英伟

OpenAI发布Evals API:AI模型测试进入程序化新时代

近日,人工智能领域的领军企业OpenAI宣布正式推出Evals API,这一全新工具的亮相迅速引发了开发者和技术圈的热烈反响。据悉,Evals API支持用户通过编程方式定义测试、自动化运行评估流程,并实现对提示(Prompt)的快速迭代优化。这一功能的发布,不仅将模型评估从手动操作推向了高度自动化的新阶段,也为开发者提供了更灵活、高效的工具,以加速AI应用的开发与优化。Evals API的核心在

奥特曼:ChatGPT不是AGI!OpenAI最强开源模型直击DeepSeek

声明:本文来自于微信公众号 新智元,作者:新智元,授权站长之家转载发布。【新智元导读】代码截图泄露,满血版o3、o4-mini锁定下周!更劲爆的是,一款据称是OpenAI的神秘模型一夜爆红,每日处理高达260亿token,是Claude用量4倍。奥特曼在TED放话:将推超强开源模型,直面DeepSeek挑战。近了,近了!全网多个流出的代码截图显示,满血版o3、o4-mini,以及o4-mini