OpenAI发布Evals API:AI模型测试进入程序化新时代

近日,人工智能领域的领军企业OpenAI宣布正式推出Evals API,这一全新工具的亮相迅速引发了开发者和技术圈的热烈反响。据悉,Evals API支持用户通过编程方式定义测试、自动化运行评估流程,并实现对提示(Prompt)的快速迭代优化。这一功能的发布,不仅将模型评估从手动操作推向了高度自动化的新阶段,也为开发者提供了更灵活、高效的工具,以加速AI应用的开发与优化。Evals API的核心在

Aqara 智能语音伴侣 H1 发布:免唤醒词、可转动敲击操控、自带磁吸,289 元

IT之家 4 月 25 日消息,Aqara 绿米今日发布了一款智能语音伴侣 H1 新品,售价 299 元,领 10 元券后 289 元,现已在京东开售。新品可选黑白两色,支持自定义语音指令,可操控房间里的其他设备,采用蓝牙和 Thread 通信协议。该设备支持免唤醒词即拿即用,且使用后自动休眠,保护隐私。续航方面,Aqara 智能语音伴侣 H1 仅使用语音功能(未激活传感器模式),官方标称正常使

​Waymo CEO暗示未来可能出售个人自动驾驶汽车

在最近的一次财报电话会议上,Alphabet 首席执行官桑达尔・皮查伊(Sundar Pichai)透露,Waymo 未来有可能会出售自动驾驶汽车供个人拥有。这一消息引起了广泛关注,皮查伊在会上被问及 Waymo 的长期商业模式时表示,除了与 Moove 和 Uber 等合作伙伴的扩展外,Waymo 还考虑 “个人所有权的未来选项”。图源备注:图片由AI生成,图片授权服务商Midjourney事实

谷歌推 I/O 版 Gemini 2.5 Pro 模型,AI 助力前端开发与复杂编程

感谢IT之家网友 华南吴彦祖、風見暉一 的线索投递!IT之家 5 月 7 日消息,科技媒体 The Decoder 昨日(5 月 6 日)发布博文,报道称谷歌为预热今年的 I/O 全球开发者大会,发布“I/O Edition”特别预览版 Gemini 2.5 Pro 模型,在前端开发和复杂编程任务上表现突出。该特别预览版 Gemini 2.5 Pro 语言模型专门面向开发者群体,主要优化了日常

英伟达 Parakeet TDT 0.6B 成开源 ASR 模型新王:1 秒 AI 转录 60 分钟音频,字错率低至 6.05%

IT之家 5 月 7 日消息,科技媒体 marktechpost 昨日(5 月 6 日)发布博文,报道称英伟达最新推出 Parakeet TDT 0.6B,是一款先进的自动语音识别(ASR)模型,已在 Hugging Face 平台上完全开源。Parakeet TDT 0.6B 的核心优势在于其无与伦比的速度和转录质量。该模型仅需 1 秒即可处理 60 分钟音频,是现有主流开源 ASR 典型模型

Arthur推出首个开源实时 AI 评估引擎Arthur Engine

随着人工智能(AI)技术的迅速发展,如何在大规模环境下有效应用这些技术成为了一大挑战。近日,Arthur正式推出了Arthur Engine,这是一款首个开源的实时 AI 评估引擎,旨在帮助团队监控、调试和改进生成式 AI 及传统机器学习(ML)模型。其最大的特点是无需依赖第三方工具,确保数据隐私安全,同时也完全免费。在2025年,实时 AI 评估的重要性愈加凸显。随着 AI 技术的广泛应用,相关

飞桨3.0正式发布,支持文心4.5等大模型,跨芯片适配成本降80

百度旗下的深度学习平台飞桨近日宣布正式发布新一代飞桨框架3.0。此次发布的框架3.0引入了五大核心技术创新,包括“动静统一自动并行”等关键技术,旨在有效降低大模型开发和训练成本,助力大模型时代的基础设施建设。作为支撑大模型训练和推理任务的核心基础设施,飞桨框架3.0在性能优化方面表现出色。该框架已经支持包括文心4.5、文心X1在内的多款主流大模型,并通过优化的DeepSeek-R1满血版单机部署,

百度飞桨框架 3.0 正式版发布,五大特性专为大模型设计

IT之家 4 月 3 日消息,百度本月发布飞桨框架 3.0 正式版,五大特性专为大模型设计。作为大模型时代的 Infra“基础设施”,深度学习框架的重要性愈发凸显,大模型训练、推理等任务都离不开深度学习框架的优化与支撑。飞桨框架 3.0 号称从设计理念上实现了从底层硬件适配到顶层开发体验的全面进化,IT之家附具体介绍如下:飞桨提出的“动静统一自动并行”技术,大幅降低大模型开发训练成本,让算法创新

Klavis AI 推出开源 MCP 集成,支持大规模用户和自定义工具

Klavis AI(YC X25)正式推出其全新的开源 MCP 集成解决方案,旨在为开发者提供一个高效、稳定的环境,以便于他们在 AI 应用中进行快速集成和部署。该项目已经在 GitHub 上发布,吸引了大量开发者的关注,迄今为止获得了973颗星和140个叉子。Klavis AI 的 MCP集成提供了一套全面的工具和资源,使得开发者能够在极短的时间内将自己的 AI 应用与生产就绪的 MCP 服务器

联影推出 “元智” 医疗大模型,助力影像诊断和智能医疗服务

在医疗科技的不断进步中,联影科技于4月9日正式发布了其最新的 “元智” 医疗大模型。这款大模型的推出不仅为医疗行业带来了新的机遇,也为医生和患者提供了更为智能的服务。联影的 “元智” 大模型结合了数千万级的医疗影像数据以及数十万级的精准标注数据,旨在提升影像诊断的效率和准确性。“元智” 医疗大模型支持超过10种影像模态,并能够处理300种影像处理任务。这意味着它可以在复杂病灶诊断、器官分割等关键任