英伟达 Parakeet TDT 0.6B 成开源 ASR 模型新王:1 秒 AI 转录 60 分钟音频,字错率低至 6.05%

IT之家 5 月 7 日消息,科技媒体 marktechpost 昨日(5 月 6 日)发布博文,报道称英伟达最新推出 Parakeet TDT 0.6B,是一款先进的自动语音识别(ASR)模型,已在 Hugging Face 平台上完全开源。Parakeet TDT 0.6B 的核心优势在于其无与伦比的速度和转录质量。该模型仅需 1 秒即可处理 60 分钟音频,是现有主流开源 ASR 典型模型

Arthur推出首个开源实时 AI 评估引擎Arthur Engine

随着人工智能(AI)技术的迅速发展,如何在大规模环境下有效应用这些技术成为了一大挑战。近日,Arthur正式推出了Arthur Engine,这是一款首个开源的实时 AI 评估引擎,旨在帮助团队监控、调试和改进生成式 AI 及传统机器学习(ML)模型。其最大的特点是无需依赖第三方工具,确保数据隐私安全,同时也完全免费。在2025年,实时 AI 评估的重要性愈加凸显。随着 AI 技术的广泛应用,相关

飞桨3.0正式发布,支持文心4.5等大模型,跨芯片适配成本降80

百度旗下的深度学习平台飞桨近日宣布正式发布新一代飞桨框架3.0。此次发布的框架3.0引入了五大核心技术创新,包括“动静统一自动并行”等关键技术,旨在有效降低大模型开发和训练成本,助力大模型时代的基础设施建设。作为支撑大模型训练和推理任务的核心基础设施,飞桨框架3.0在性能优化方面表现出色。该框架已经支持包括文心4.5、文心X1在内的多款主流大模型,并通过优化的DeepSeek-R1满血版单机部署,

百度飞桨框架 3.0 正式版发布,五大特性专为大模型设计

IT之家 4 月 3 日消息,百度本月发布飞桨框架 3.0 正式版,五大特性专为大模型设计。作为大模型时代的 Infra“基础设施”,深度学习框架的重要性愈发凸显,大模型训练、推理等任务都离不开深度学习框架的优化与支撑。飞桨框架 3.0 号称从设计理念上实现了从底层硬件适配到顶层开发体验的全面进化,IT之家附具体介绍如下:飞桨提出的“动静统一自动并行”技术,大幅降低大模型开发训练成本,让算法创新

Klavis AI 推出开源 MCP 集成,支持大规模用户和自定义工具

Klavis AI(YC X25)正式推出其全新的开源 MCP 集成解决方案,旨在为开发者提供一个高效、稳定的环境,以便于他们在 AI 应用中进行快速集成和部署。该项目已经在 GitHub 上发布,吸引了大量开发者的关注,迄今为止获得了973颗星和140个叉子。Klavis AI 的 MCP集成提供了一套全面的工具和资源,使得开发者能够在极短的时间内将自己的 AI 应用与生产就绪的 MCP 服务器

联影推出 “元智” 医疗大模型,助力影像诊断和智能医疗服务

在医疗科技的不断进步中,联影科技于4月9日正式发布了其最新的 “元智” 医疗大模型。这款大模型的推出不仅为医疗行业带来了新的机遇,也为医生和患者提供了更为智能的服务。联影的 “元智” 大模型结合了数千万级的医疗影像数据以及数十万级的精准标注数据,旨在提升影像诊断的效率和准确性。“元智” 医疗大模型支持超过10种影像模态,并能够处理300种影像处理任务。这意味着它可以在复杂病灶诊断、器官分割等关键任

谷歌开源智能体开发套件:ADK震撼发布,引领AI代理开发新浪潮

2025年4月9日,在拉斯维加斯举办的Google Cloud Next2025大会上,谷歌正式发布了Agent Development Kit(ADK),一款全新的开源智能体开发框架。这款基于Python的工具包旨在简化多智能体系统的构建、管理和部署流程,被视为AI代理开发领域的重大突破。ADK的发布不仅展示了谷歌在人工智能领域的雄心,也为全球开发者提供了一个灵活、高效的平台,推动AI技术在企业

MiniMax MCP Server 上线 文本输入即可调用

今日,MiniMax稀宇科技宣布其MiniMax MCP Server正式上线。这一创新平台为用户带来了一站式的多模态解决方案,只需简单文本输入,即可调用视频生成、图像生成、语音生成和声音克隆等多项前沿能力,极大地拓展了人工智能在创意内容生成领域的应用边界。平台亮点强大的多模态功能:MiniMax MCP Server支持多种模态的生成能力,包括但不限于视频、图像、语音以及声音克隆。这一功能的实现

AI日报:夸克发布“深度搜索”新品;Anthropic推Claude网络搜API;DeepSeek致谢腾讯技术团队;微软采用谷歌的A2A标准

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、夸克发布“深度搜索”新品:AI先思考后检索,解决复杂问题更聪明夸克最近推出了全新的“深度搜索”产品,标志着其在智能搜索领域的重大进展。该产品依托阿里自研推理大模型,通过对用户

饿了么推出骑手 AI 助手“小饿”:可主动发出天气预警、封路提示

IT之家 4 月 25 日消息,饿了么今日宣布推出骑手智能 AI 助手“小饿”,这是国内首个基于大模型技术打造的骑手端智能体,旨在通过自然语言处理(NLP)、多模态交互及实时数据分析能力,为骑手打造专属智能伙伴,覆盖骑手的配送场景,提升骑手的效率和体验。据IT之家了解,“小饿”具有三大核心能力。语音交互与智能响应:支持语音唤醒,可直接完成接单、确认到店、查询活动等操作,减少手动点击步骤,提升操作

Secretary自媒体神器发布,自动化社交媒体分析赋能多场景应用

一款名为Secretary的AI驱动自媒体工具正式亮相,专注于自动化跟踪与分析社交媒体内容,并将结果以Markdown格式推送至微信平台。据AIbase了解,Secretary支持Truth Social和Twitter(现为X)两大平台,允许用户为不同账号设置定制化分析主题(如财经、政治、科技),并实现多团队定向推送。该工具的发布在开发者与企业用户中引发广泛关注,已通过GitHub开源。核心功能

全国首个开源鸿蒙智慧楼宇样板点发布:自动调节灯光空调,访客轨迹实时追踪

IT之家 4 月 29 日消息,在今日的第八届数字中国建设峰会期间,福州市城乡建总集团有限公司(以下简称“城乡建总”)与深圳开鸿数字产业发展有限公司(以下简称“深开鸿”)联合打造的全国首个基于开源鸿蒙的智慧楼宇样板点在福州建总大厦正式发布。这一项目以“让建筑成为可进化的智慧有机生命体”为目标,通过开源鸿蒙技术重构楼宇管理模式。深开鸿介绍称,城乡建总与深开鸿深度合作,以开源鸿蒙技术为核心、以“开鸿

Qwen3即将来袭:阿里云新模型相关支持已正式合并至vLLM代码库

近日,阿里云旗下人工智能大模型系列Qwen迎来重要进展,其下一代模型Qwen3的相关支持已正式合并至vLLM(高效大语言模型推理框架)的代码库中。这一消息迅速引发了科技圈的热烈讨论,标志着Qwen3的发布已进入倒计时阶段。据悉,Qwen3将包含至少两个版本:Qwen3-8B和Qwen3-MoE-15B-A2B,分别代表不同规模和架构的创新尝试,为开发者与企业用户带来了更多期待。Qwen3-8B作为

AI视频生成技术TTT:可直出一分钟完整猫和老鼠动画 无需编辑、拼接

近日,一项名为《One-Minute Video Generation with Test-Time Training》(一分钟视频生成与测试时训练)的全新研究论文正式发布,标志着人工智能视频生成技术迈入了一个崭新阶段。该研究通过在预训练Transformer模型中引入创新的测试时训练(TTT)层,成功实现了生成一分钟《猫和老鼠》(Tom and Jerry)动画视频的壮举。这一技术不仅在时间跨度

美国民众对人工智能的信任危机加剧

最近,皮尤研究中心发布的一项新报告显示,美国民众对人工智能的看法与行业专家之间存在明显的差距。该调查包含了超过1,000名人工智能专家和超过5,000名美国成年人,揭示出公众对这一技术的焦虑和不安日益加剧。图源备注:图片由AI生成,图片授权服务商Midjourney调查结果显示,约四分之三的人工智能专家认为,这项技术将对他们个人带来好处。而在公众中,只有四分之一的人持相同看法。专家们普遍认为人工智

节目效果拉满!AI机器人遇“椅子危机”破防 人类主持救场成亮点

快科技4月13日消息,近日,第七届中国升学指导大会在湖北武汉隆重开幕。作为国内规模最大、规格最高的国际教育盛会之一,本届大会由ChinaICAC升学指导研究中心主办,武汉爱莎学校承办,吸引了来自近20个国家和地区的全球教育工作者参会。公开资料显示,本届大会共邀请到500余名教育从业者,包括世界名校招生官(如剑桥大学等)、全国知名国际学校校长及教师等。各方齐聚一堂,共同探讨国际教育新趋势,为青少

微软 CEO 纳德拉:公司 20%-30% 的代码由 AI 生成

IT之家 4 月 30 日消息,在本周二举行的 Meta LlamaCon 大会上,微软首席执行官萨提亚・纳德拉(Satya Nadella)在与 Meta 首席执行官马克・扎克伯格的对话中透露,微软公司代码库中有 20% 至 30% 的代码是由人工智能写的。纳德拉表示,在不同编程语言中使用人工智能生成代码的效果存在差异。在 Python 语言中,人工智能生成代码的进展较为显著,而在 C++ 语

夸克AI超级框推出“深度搜索”功能:让搜索拥有“高搜商”

站长之家(ChinaZ.com)5月8日 消息:阿里巴巴旗下AI旗舰应用夸克近日推出“深度搜索”产品,并升级“图片智能处理”功能,通过强化AI的深度思考与信息整合能力,进一步拓展AI工具的应用边界。基于阿里自研推理大模型及每日数十亿次搜索请求的算法优化,夸克“深度搜索”被赋予“高搜商”特性,即高效获取、筛选与利用信息的能力,以应对复杂场景下的用户需求。在复杂问题解决层面,“深度搜索”采用“先思

AIGC第一股年报详解:AIGC业务暴涨88.5%营收2.2亿,95%智能硬件交付出海,跑通规模化「软件订阅+出海」

声明:本文来自于微信公众号 量子位,作者:量子位,授权站长之家转载发布。 上市一年后,港股AIGC第一股交出了第一份、也是足够亮眼的一份年终财报。出门问问日前发布2024年度业绩报告,关键数字如下: AIGC业务营收突破2.2亿,同比增长88.5%; 全年毛利2亿元,

支付宝面向AI开发者推出“支付MCP Server” 快速实现AI智能体内支付

随着大模型加速落地应用,打通AI系统与现有数字商业链的连接,成为行业关键命题。4月15日,支付宝联合魔搭社区率先在国内推出“支付MCP Server”服务,让AI智能体一键接入支付能力,打通从AI服务到AI商业化的“最后一公里”。据测试,AI开发者可以使用自然语言接入支付宝支付服务,快速实现AI智能体内的支付。目前该产品在魔搭社区MCP广场、支付宝百宝箱、支付宝开放平台等平台首发上线。图:支付宝联