Gemini-2.5-pro在MathArena评测中展现卓越数学能力 远超其他模型

2025年4月3日消息:根据MathArena最新发布的大语言模型数学能力评测结果显示,Google的Gemini-2.5-pro以绝对优势领跑,在未污染的高难度数学竞赛中展现出令人瞩目的表现。突破性成绩Gemini-2.5-pro在MathArena平台的严格评测中取得了24.40%的准确率,这一成绩不仅位居榜首,更是与第二名DeepSeek-R1 的4.76%形成鲜明对比,领先优势达到惊人的五

英伟达推 DAM-3B 模型:突破局部描述难题,让 AI 看懂图像 / 视频每一个角落

IT之家 4 月 24 日消息,科技媒体 marktechpost 昨日(4 月 23 日)发布博文,报道称英伟达为应对图像和视频中特定区域的详细描述难题,最新推出了 Describe Anything 3B(DAM-3B)AI 模型。视觉-语言模型(VLMs)在生成整体图像描述时表现出色,但对特定区域的细致描述往往力不从心,尤其在视频中需考虑时间动态,挑战更大。英伟达推出的 Describe

谷歌 AI 编程助手 Gemini Code Assist 新增“代理”功能,可多步骤完成复杂任务

IT之家 4 月 10 日消息,在本周三的谷歌 Cloud Next 大会上,谷歌宣布其 AI 编程助手 Gemini Code Assist 新增“代理”功能。谷歌表示,Code Assist 如今能够部署新的 AI“代理”,这些代理能够通过多步骤完成复杂的编程任务。例如,它们可以根据 Google Docs 中的产品规格创建应用程序,或者将代码从一种语言转换为另一种语言。此外,Code As

Quasar Alpha神秘亮相:首款“隐秘”长上下文模型开启免费体验

近日,一款名为“Quasar Alpha”的全新AI模型悄然上线,引发了科技界和开发者的广泛关注。据悉,这款模型由一家未具名的模型实验室推出,被称为其首款“隐秘”(stealth)模型,是即将发布的一款长上下文基础模型的预发布版本。Quasar Alpha以其惊人的100万token上下文长度、优化的编码能力以及免费开放的特点,迅速成为业界热议的焦点,为AI技术的未来发展增添了更多期待。Quasa

商汤日日新 SenseNova V6 多模态融合大模型发布

IT之家 4 月 10 日消息, “商汤日日新 SenseNova V6”多模态融合大模型于今日发布,具备最长 64K 思维链、数理分析、多模态深度推理、全局记忆等能力,支持 10 分钟的视频推理及深度推理。据IT之家了解,日日新(SenseNova),是商汤科技宣布推出的大模型体系,包括自然语言处理模型“商量”(SenseChat)、文生图模型“秒画”和数字人视频生成平台“如影”(SenseA

高德发布全球首个地图领域AI导航智能体 已陆续向用户推送

高德地图宣布推出全球首个基于地图的 AI 导航智能体(NaviAgent),这一创新成果标志着导航服务从传统的出行工具向具有思考、预判和温度的智能出行伙伴转变。该智能体采用“思考 - 预判 - 行动”的全链路智能模式,通过感知、规划、执行和表达四大模块构建智能闭环,集成 TrafficVLM 交通感知模型和 AmapVoice 情感语音技术等多项核心技术,实现了从“工具思维”到“伙伴思维”的转换。

​清华大学成立人工智能医院 迈向智慧医疗新篇章

清华大学正式成立人工智能医院,标志着该校在 “AI + 医疗” 领域迈出了重要一步。4月26日,清华大学举行了人工智能医院的揭牌仪式,并在医学院全体教职工大会上进行了相关介绍。校长李路明、副校长王宏伟等多位领导出席了此次仪式,共同见证了这一历史性时刻。清华大学人工智能医院(Tsinghua AI Agent Hospital)将分阶段建设,初期将依托北京清华长庚医院及其互联网医院进行试点。这一新医

Meta高端智能眼镜"Hypernova"曝光:内置屏幕,售价或达1400美元

据彭博社报道,Meta正在准备推出一款内置屏幕的雷朋Meta智能眼镜高端版本,最早可能于今年年底面世。这款代号为"Hypernova"的新眼镜将支持运行应用程序和显示照片,用户可通过手势和镜框两侧的电容式触摸进行控制。根据报道,Hypernova的屏幕仅会出现在右侧镜片的右下象限,用户向下看时观看效果最佳。设备启动后,主屏幕将水平排列显示图标,布局类似于Meta Quest虚拟现实设备的界面。图源

小身材,大智慧!微软Phi-4系列推理模型发布,性能直逼GPT-4o

微软正积极扩展其Phi系列紧凑型语言模型,最新发布了三款专为高级推理任务设计的新变体:Phi-4-reasoning、Phi-4-reasoning-plus 和 Phi-4-mini-reasoning。这些模型旨在通过结构化推理和内部反思处理复杂的问答,同时保持轻量级特性,使其能够在包括移动设备在内的低端硬件上高效运行,延续了微软Phi系列在资源受限设备上实现强大AI功能的愿景。Phi-4-r

mcp-agent发布:轻量级框架助力智能体应用高效构建

mcp-agent正式发布,作为一款基于模型上下文协议(MCP)的轻量级框架,旨在为开发者提供一个简化的智能体应用构建解决方案。该框架不仅能够与其他MCP服务无缝集成,还具备高度的可组合性和可定制性,使得开发者能够更专注于核心业务逻辑的实现,而无需过多关注复杂的系统架构。mcp-agent的设计理念是简洁而高效,它去除了传统框架中多余的模块,提供了一个轻量级的代理模式库。开发者可以在此基础上快速构