ElevenLabs推出MCP服务器:AI语音能力无缝整合到智能助手

ElevenLabs最新推出的MCP(Multi-modal Communication Protocol)服务器为AI生态系统带来重大升级。这项服务允许用户通过简单的文本提示,让AI助手(如Claude、Cursor、Windsurf等)直接访问ElevenLabs的完整AI音频平台能力。MCP服务器本质上充当了一座桥梁,将ElevenLabs先进的文字转语音、语音克隆等技术连接到用户日常使用的

PokemonGym:AI玩宝可梦Red,Claude仅用450步征服

在人工智能领域不断突破的今天,一个名为 PokemonGym 的创新项目正悄然兴起,引起了游戏爱好者和AI研究者的广泛关注。PokemonGym 是一套专门为评估人工智能(AI)代理在经典游戏《宝可梦Red》中表现的服务平台。通过构建一套完善的服务器-客户端架构,PokemonGym 使得开发者可以训练和测试各种AI算法在虚拟的游戏世界中自主行动。PokemonGym的核心功能:让AI自主探索宝可

Cloudflare 发布 Node.js 生态 Agents 开发包,助力 AI 代理开发

近日,Cloudflare 推出了一款面向 Node.js 生态的 Agents 开发包,为开发者提供了一套完整的 AI 代理开发基础设施。这一开发包集成了多项核心功能,包括工作流引擎、工具集成框架、多代理协作平台(MCP)以及状态持久化支持,旨在简化 AI 代理的构建与部署流程。据介绍,该开发包能够帮助开发者轻松实现自动化任务执行、多工具协同以及动态适应上下文的能力。Cloudflare 官网还

GitHub 官方开源 MCP 服务器,支持无缝集成 GitHub API

近日,GitHub 正式开源了一款全新的 MCP(Model Context Protocol)服务器,与 GitHub API 无缝集成,为开发者带来更高效的工作流体验。据悉,该服务器由 GitHub 联合 Anthropic 开发,采用 Go 语言重写,相较旧版功能更强大且易用。它保留了旧版服务器的所有功能,并新增了对自动化 GitHub 工作流的支持,能够从 GitHub 仓库中提取问题、获

Runway发布Gen-4 Turbo:AI视频生成速度再创新高

近日,人工智能视频生成领域的领军企业Runway宣布推出其最新模型“Gen-4Turbo”,为AI驱动的视频创作带来了显著的技术升级。据悉,这一版本在生成速度上实现了重大突破,仅需30秒即可生成一段10秒的高质量视频。这一进展不仅提升了创作效率,也进一步巩固了Runway在生成式AI领域的领先地位,为影视制作、广告设计等行业注入了新的活力。Gen-4Turbo是Runway Gen-4系列的最新迭

​Geekplus 连续四年入选全球顶级机器人公司,助力仓储效率革命

全球储机器人领域的领导者 Geekplus 自豪地宣布,再次获得《机器人商业评论》(RBR) 颁发的 2025 年 RBR50 创新奖,这也是该公司连续第四次获得此殊荣。Geekplus 与全球科技巨头如 ABB 和 Nvidia 一同,被誉为机器人行业的 “奥斯卡”,以其在技术进步、商业影响和行业领导力方面的突出表现而备受认可。Geekplus 的 SkyCube 托盘到人解决方案以其创新的集成

夸克AI加持!阿里智能AI眼镜或于2025年底发布

根维深信息Wellsenn XR消息,阿里巴巴已正式敲定AI智能眼镜项目方案,并正加速招聘和扩充团队。该项目由智能信息事业群天猫精灵团队主导,旨在推出硬件规格超越Ray-Ban Meta的智能眼镜产品。据悉,阿里AI智能眼镜采用高通AR1芯片与恒玄BES2800的双芯片双系统架构,优化功耗与续航表现。摄像头沿用Ray-Ban Meta的索尼IMX681CMOS(1200万像素),由立景提供模组,整

五菱发布 “灵语座舱”:让沟通不再有障碍的智能驾驶舱

五菱汽车正式推出了全新的 “灵语座舱”,该产品融合了先进的灵语 AI 中枢大模型,旨在突破语言沟通的障碍。这一座舱系统的核心优势在于其强大的方言识别能力,承诺能够让不同地方的用户无障碍地交流。灵语 AI 中枢大模型的设计理念是通过感知、理解、表达和交互的全面升级,为用户提供更加智能和便捷的驾驶体验。该系统不仅支持智能调度,还内置了多项技术,比如语义拼接技术、知识蒸馏技术以及多音区对话分离技术,使得

Mozilla发布LocalScore:简化本地AI模型基准测试的新工具

Mozilla 最近通过其 Mozilla Builders 计划推出了一款名为 LocalScore 的工具,旨在为本地大型语言模型(LLM)提供便捷的基准测试。该工具兼容 Windows 和 Linux 系统,具有极大的潜力,成为了易于分发的 LLM 框架的重要组成部分。尽管 LocalScore 仍处于早期开发阶段,但其表现已相当不错。LocalScore 是基于上周发布的 Llamafil

​美国多家媒体呼吁政府要求OpenAI等科技公司为AI使用的内容付费

近日,多家知名出版商组成的新闻 / 媒体联盟向美国政府发出呼吁,要求大型科技公司为其人工智能产品所使用的内容支付费用。该联盟包括《纽约时报》、《卫报》等国际知名媒体,发起了一项名为 “支持负责任的人工智能” 的活动,指责这些公司在创建人工智能产品时,未经授权窃取创作者的创意和内容,而不向创作者提供任何报酬。该活动的官方网站强调,这种行为是 “非美国式的、错误的”。这些大型科技公司正在利用各种创作者

前苹果设计总监最新最开发项目或为一款无屏 AI 手机

据The Information报道,OpenAI 正在考虑收购一家公司,这家公司由前苹果设计总监 Jony Ive 和 OpenAI 首席执行官 Sam Altman 共同创立,名为 “io Products”。该公司专注于开发新型人工智能设备,包括一款可能没有屏幕的 “手机”,以及其他适用于家庭的智能产品。尽管项目接近的人士表示,这款产品并不完全是传统意义上的手机。Ive 与 Altman 的

Meta高管回应Llama 4训练作弊传言:坚决否认不实指控

在近日的社交媒体上,Meta 公司的高层对关于其新 AI 模型 Llama4的 “不当训练” 指控进行了澄清,称这些说法完全不属实。指控声称 Meta 在其新推出的 Llama4Maverick 和 Llama4Scout 模型上,通过在特定基准测试的 “测试集” 上进行训练,以此来人为提高模型的性能表现。Meta 的生成式人工智能副总裁艾哈迈德・阿尔・达赫勒(Ahmad Al-Dahle)在社交

谷歌DeepMind被曝启用“激进”竞业禁止协议 ,离职一年内不得为竞争对手工作

在竞争激烈的人工智能行业中,谷歌的 AI 部门 DeepMind 采取了极端措施,以留住顶尖人才。据《商业内幕》报道,该公司在英国的部分 AI 员工签署了 “激进” 的竞业协议,这意味着这些员工在离职后的一年内不得为竞争对手工作。这种协议不仅限制了员工的职业选择,还让他们在这一年中无法参与行业内快速发展的技术进步。有报道称,这些员工在协议期间仍会领取工资,实际上相当于一段长达一年的带薪休假。然而,

​谷歌将多模态搜索功能引入AI模式,用户可询问图像内容

谷歌近日在其博客中宣布,将多模态搜索功能引入 AI 模式,这一新功能允许用户通过复杂的问题深入了解图像内容。此功能为有权使用 AI 模式的用户提供,用户现在可以直接对他们上传或用相机拍摄的照片进行提问。AI 模式中的新图像分析功能是基于Google Lens 的多模式技术。谷歌表示,该模式能够理解图像中的整个场景,包括物体之间的关系、材质、颜色、形状及排列等。通过一种称为 “查询扇出” 的技术,用

Meta Llama4强势登场,却在长上下文任务中翻车

一项新的独立评估显示,Meta 最新推出的 Llama4模型——Maverick 和 Scout 在标准测试中表现出色,但在复杂长上下文任务中表现欠佳。根据人工智能分析的“智能指数”,Maverick 得分49分,领先 Claude3.7Sonnet(得分未具体列出),但落后于 Deepseek V30324(53分);Scout 得分36分,与 GPT-4o-mini 相当,优于 Claude3

​亚马逊 AI 视频模型 Nova Reel 升级:可生成长达两分钟的视频片段

亚马逊近日对其 AI 视频生成模型 Nova Reel 进行了升级,推出了 Nova Reel1.1版本。这个新版本不仅能够生成长达两分钟的视频片段,还可以制作多镜头视频,使得各个镜头之间的风格保持一致。Nova Reel 于2024年12月首次发布,是亚马逊在生成视频领域的重要尝试。据 AWS 开发倡导者 Elizabeth Fuentes 在一篇博文中透露,用户可以通过提供最长4,000个字符

​谷歌 Gemini Live 屏幕共享功能开始支持 Pixel 9 和 Galaxy S25 手机

近日,谷歌宣布其最新的 Gemini Live 摄像头和屏幕共享功能正在向 Pixel9系列手机和三星 Galaxy S25设备推送。这一更新将使用户能够通过对话式 AI 聊天机器人实时获得与周围环境相关的信息,极大提升了手机的互动性和实用性。虽然目前这一功能仅限于新款设备,但谷歌表示,未来将向更多安卓设备推出,但使用该功能的用户需要成为 Gemini Advanced 的付费订阅用户。Gemin

​Shopify CEO要求团队要招聘新成员前,需先证明AI无法完成工作

近日,Shopify 首席执行官托比・吕特克(Tobi Lütke)向员工发出了一份备忘录,强调在寻求增加人手或资源之前,团队必须证明为什么他们 “无法通过人工智能(AI)完成所需工作”。吕特克在备忘录中提到,这个要求旨在促进团队思考如何将 AI 融入工作流程,并激发创新。图源备注:图片由AI生成,图片授权服务商Midjourney吕特克在备忘录中提出了一个重要问题:“如果自动化 AI 代理已经是

Supabase正式推出MCP服务器:AI与数据库无缝融合迈出新步伐

近日,开源数据库平台Supabase宣布正式推出其官方MCP服务器(Model Context Protocol Server),这一举措标志着其在人工智能与数据库管理整合领域迈出了重要一步。据悉,该服务器能够让Supabase与Cursor、Claude等主流AI工具实现无缝连接,使AI助手能够直接操作Supabase的数据库、项目管理和配置功能。这一技术的亮相,不仅提升了开发者的工作效率,也为

阿里推出OmniTalker:AI视频生成技术再突破,单参考视频实现风格化语音与表情同步

近日,阿里巴巴旗下研发团队发布了一项名为“OmniTalker”的全新AI技术项目,该项目凭借其惊艳的视频生成能力迅速引发业界关注。据悉,OmniTalker仅需一段参考视频,便能精准捕捉视频中人物的语音风格与面部表情,并以此为基础生成唇形同步、表情自然的动态视频。这一技术的亮相,不仅展现了阿里在生成式AI领域的深厚实力,也为视频内容创作带来了革命性的可能性。OmniTalker的核心优势在于其“