谷歌 Gemini AI 升级文件分析功能,将支持 3GP、AVI、MP4 等 8 种视频格式

IT之家 4 月 8 日消息,科技媒体 Android Authority 今天(4 月 8 日)发布博文,通过分析 APK 文件,发现谷歌 Gemini 即将升级文件分析功能,新增支持 3GP、AVI、FLV 等 8 种视频格式。Gemini 现有文件分析功能支持文档、代码、表格等类型,但暂不支持视频处理。该媒体分析 Google App 16.13.38 测试版代码,发现 Gemini 该功

高德地图推出全球首个基于地图的 AI 导航智能体

高德地图宣布推出全球首个基于地图的 AI 导航智能体,并在全国范围内正式上线。这一创新举措标志着导航服务从传统的出行工具向“会思考、能预判、有温度”的智能出行伙伴转变。此次上线的红绿灯 AI 领航功能,是高德地图在智能导航领域的一次重大突破。该功能通过强大的数字化和 AI 超视距感知领航技术体系,推演出红绿灯场景下的最优驾驶决策,为驾驶员提供全方位的过灯决策支持。红绿灯 AI 领航功能的上线,不仅

扣子空间Coze Space正式开启内测 支持 MCP 扩展集成

字节跳动技术团队宣布,其全新 AI 协同办公平台“扣子空间”(Coze Space)正式开启内测。“扣子空间”旨在成为用户与 AI Agent 协同办公的最佳场所,提供从回答问题到解决问题的全方位服务,帮助用户更高效地完成工作。“扣子空间”具有多项创新特点,能够自动分析用户需求并拆解为多个子任务,自主调用工具(如浏览器、代码编辑器等)执行任务,并输出完整的结果报告,如网页、PPT、飞书文档等。此外

企业需拥抱 “B2AI” 时代:与AI代理人的新型商业模式

随着人工智能(AI)的快速发展,商业模式也在悄然发生变化。过去我们熟悉的 “B2C”(企业对消费者)和 “B2B”(企业对企业)模式,正在迎来一个全新的概念 ——“B2AI”(企业对 AI)。根据 Visa 与未来研究所的最新报告,这一转变可能会对商业和个人金融产生深远的影响。报告指出,虽然许多人尚未普遍使用个人 AI 工具,但这些技术已经悄然进入市场。就像企业为了吸引消费者而调整搜索引擎优化(S

小米开源“Xiaomi MiMo”大模型:为推理而生,以 7B 参数超越 OpenAI o1-mini

感谢IT之家网友 软媒用户1392612 的线索投递!IT之家 4 月 30 日消息,小米大模型团队通过“Xiaomi MiMo”公众号宣布,今天,小米开源首个“为推理而生”的大模型 Xiaomi MiMo,联动预训练到后训练,全面提升推理能力。据介绍,MiMo 是来自全新成立不久的“小米大模型 Core 团队”的初步尝试。在数学推理(AIME 24-25)和代码竞赛(LiveCodeBenc

高考考上985的AI来了!超强数理推理横扫真题,训练秘籍剑指AGI

声明:本文来自于微信公众号 新智元,授权站长之家转载发布。就在刚刚,全球首个工业界多模态推理模型Skywork-R1V,再次重磅升级!此前,R1V1.0首次成功实现了「强文本推理能力向视觉模态的迁移」,才短短一个月后,Skywork-R1V2.0就强势上线了。现在,R1V2.0的所有资源已全面开源,可以预见,多模态推理社区将迎来新一轮发展。模型权重:https://huggingface.co

红杉投资AI初创公司Listen Labs筹集2700万美元,颠覆市场研究行业

近日,红杉资本投资的人工智能初创公司Listen Labs宣布,已成功筹集到2700万美元的融资,旨在颠覆传统的市场研究行业。公司通过创新的人工智能技术,实现了在数千个语音访谈中同时进行客户研究,极大提升了调研效率和精度。AI驱动的语音访谈,打破市场研究的时间与成本壁垒Listen Labs的核心技术依赖于先进的人工智能模型,能够在短短几小时内完成传统市场研究方法数天甚至数周才能完成的工作。客户只

字节跳动推出DreamActor-M1:实现Runway Act 功能,挑战动画生成新高度

近日,字节跳动(ByteDance)正式公布了其最新AI项目“DreamActor-M1”,一项旨在革新视频生成技术的前沿成果。这款模型通过结合一张静态照片和一段参考动作视频,能够将照片中的人物无缝替换到视频场景中,生成表情细腻、动作自然且画质高清的动态影像。这一技术的亮相,不仅标志着字节跳动在生成式AI领域的又一次突破,也被视为对现有动画生成工具(如Runway的Act-One)的有力挑战。Dr

​通义千问Qwen3发布:推理能力显著增强 支持两种思考模式

通义千问团队宣布推出Qwen3,这是Qwen系列大型语言模型的最新成员。Qwen3系列模型在代码、数学和通用能力等基准测试中表现出色,与DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等顶级模型相比,展现了极具竞争力的结果。其中,小型MoE模型Qwen3-30B-A3B的激活参数数量仅为QwQ-32B的10%,但表现更胜一筹,而像Qwen3-4B这样的小模型

研究发现:RAG系统中文档数量影响AI语言模型性能

耶路撒冷希伯来大学的研究人员最近发现,在检索增强生成(RAG)系统中,即使总文本长度保持不变,处理的文档数量也会显著影响语言模型的性能。研究团队利用MuSiQue验证数据集中的2,417个问题进行实验,每个问题链接到20个维基百科段落。其中两到四段包含相关答案信息,其余段落作为干扰项。为研究文档数量的影响,团队创建了多个数据分区,逐步将文档数量从20个减少到最少只保留包含相关信息的2-4个文档。为

百度搜索开放 AI 大门:发布 AI 开放计划 流量与收益双驱动

在百度 Create 开发者大会上,百度创始人李彦宏前瞻性地指出,AI 应用即将迎来井喷式发展,其形态将呈现多样化,包括智能体、H5、小程序和独立 App 等。面对这一变革,百度搜索宣布全面敞开大门,积极拥抱各类 AI 应用,构建多元化的内容和服务生态机制,旨在为用户提供最新最全的 AI 服务,并为开发者带来流量和收益的双重利好。为落实这一战略,百度搜索正式发布了“AI 开放计划”(sai.bai

突发!OpenAI将收购谷歌浏览器Chrome

声明:本文来自于微信公众号AIGC开放社区,授权站长之家转载发布。今天凌晨4点,路透社消息,OpenAI一位高管在谷歌垄断案庭审中作证,将收购其浏览器Chrome。目前,谷歌在美国正遭遇反垄断审判,如果上诉失败不仅Chrome会被拆分,其数字广告业务也会被剥离,会对谷歌进行大重组。今天凌晨1点左右,华盛顿邮报最早报道了谷歌被起诉的消息。美国司法部要求法官通过强制销售Chrome来打破谷歌的搜索

清明假期广西高速启用AI治理拥堵 无人机精准喊话

快科技4月6日消息,清明假期前夕,广西交通投资集团计算中心路网先知”智慧交通大模型全面启航,以预测调度处置”全链路数字化管理为核心,公众出行体验迈入智慧新时代。相较于传统的人力巡查模式,今年清明出行保障实现了跨越式升级。不仅在南宁东、长塘等关键收费站区域巧妙布局了无人机机场,更在崇左、钦州等易拥堵路段部署了车载无人机,空天地”全方位协同治堵,确保全域巡查无死角。这些无人机不仅眼观六路”,还搭载

天津:争建国家脑机接口技术创新中心

IT之家 4 月 16 日消息,IT之家从天津市科学技术局获悉,《天津市促进人工智能创新发展三年行动方案 (2025-2027 年)(征求意见稿)》昨日公开征求意见。《方案(征求意见稿)》提到,推动前沿基础理论研究,支持自然语言处理、机器视觉、深度学习、感知算法、大模型训练架构等基础算法研究;支持数据安全、模型安全、应用安全等技术的研发;巩固脑机交互技术优势,推动脑机交互与人机共融技术研发应用;

​谷歌将多模态搜索功能引入AI模式,用户可询问图像内容

谷歌近日在其博客中宣布,将多模态搜索功能引入 AI 模式,这一新功能允许用户通过复杂的问题深入了解图像内容。此功能为有权使用 AI 模式的用户提供,用户现在可以直接对他们上传或用相机拍摄的照片进行提问。AI 模式中的新图像分析功能是基于Google Lens 的多模式技术。谷歌表示,该模式能够理解图像中的整个场景,包括物体之间的关系、材质、颜色、形状及排列等。通过一种称为 “查询扇出” 的技术,用

​谷歌 CEO 皮查伊透露:超 30% 的代码由 AI 生成

在最近的 Alphabet Q12025财报电话会议上,谷歌 CEO 皮查伊透露,谷歌目前超过30% 的代码是借助人工智能(AI)生成的。这意味着开发者在每三次代码更改中,就有一次是接受了 AI 的建议。皮查伊指出,随着更强大的模型和主动工作流程的引入,AI 辅助编程在各个团队中的应用势头强劲。主动工作流程是指能够规划和执行多步骤任务的 AI 系统。他表示:“我们正在公司各个部门推广这些更深层次的

美图WHEE推出图像生成模型 Miracle F1 :风格多元更逼真

近日,WHEE 平台推出了全新的人工智能图像生成模型 Miracle F1,该模型以其极高的图像生成质量和对复杂概念的精准理解,为 AI 图像创作领域带来了新的突破。Miracle F1的一大亮点是其能够生成极具真实感的图像。它能够像摄影师一样理解物体的反光效果,像建筑师一样精准地计算空间透视关系,像画家一样捕捉光线流动的轨迹,从而实现了画面质感和语义理解的跨越式升级。通过智能模拟真实世界的光影和

小米推出 REDMI 投影仪 3 Lite 版:180CVIA 流明亮度,国补价 594.15 元

IT之家 4 月 17 日消息,小米 REDMI 投影仪 3 Lite 版现已在京东平台上架,售价 699 元,国补价 594.15 元,将于 4 月 22 日 20:00 开售。IT之家从商品页面获悉,这款新品搭载全新定制密闭式光机与全玻镜头,将侧投角度拓展至 20°。散热系统升级优化,噪音较上代产品降低 2dB(A)。新品亮度提升至 180CVIA 流明,有效过滤 415nm-455nm 范

DeepWiki:AI驱动的GitHub代码库百科全书正式亮相

2025年4月27日 AIbase报道,由Cognition AI推出的DeepWiki项目近日引发广泛关注。这一创新平台旨在为GitHub上的开源代码库生成动态、可交互的文档,堪称“代码库的维基百科”。规模宏大的代码索引DeepWiki的核心亮点之一是其惊人的数据处理能力。据悉,该平台已索引超过3万个热门GitHub仓库,处理了超过40亿行代码。这一庞大的数据基础不仅展示了DeepWiki的技术

谷歌 AI 模式新增多模态搜索,支持图像提问功能

感谢IT之家网友 咩咩洋 的线索投递!IT之家 4 月 8 日消息,谷歌正在为其谷歌搜索实验项目“AI 模式”引入多模态搜索功能。AI 模式允许用户提出复杂且包含多个部分的问题,并通过追问深入探索相关主题。如今,拥有 AI 模式访问权限的用户可以点击该功能,针对他们上传的照片或使用相机拍摄的照片提出问题。IT之家注意到,谷歌在本周一的博客文章中表示,AI 模式中的新图像分析功能由 Google