谷歌 AI 模式新增多模态搜索,支持图像提问功能

感谢IT之家网友 咩咩洋 的线索投递!IT之家 4 月 8 日消息,谷歌正在为其谷歌搜索实验项目“AI 模式”引入多模态搜索功能。AI 模式允许用户提出复杂且包含多个部分的问题,并通过追问深入探索相关主题。如今,拥有 AI 模式访问权限的用户可以点击该功能,针对他们上传的照片或使用相机拍摄的照片提出问题。IT之家注意到,谷歌在本周一的博客文章中表示,AI 模式中的新图像分析功能由 Google

Meta 高管澄清:新 AI 模型 Llama 4 训练“作弊”传言不属实

IT之家 4 月 8 日消息,Meta 公司的一位高管出面澄清了一则关于公司新 AI 模型的不实传言。该传言声称 Meta 在其新推出的 Llama 4 Maverick 和 Llama 4 Scout 模型上存在不当行为,即通过在特定基准测试的“测试集”上进行训练来提升模型的测试表现,同时隐藏模型的不足之处。Meta 公司生成式人工智能副总裁艾哈迈德・阿尔・达赫勒(Ahmad Al-Dahle

消息称谷歌付钱让部分 AI 员工赋闲一年,以防其投奔竞争对手

IT之家 4 月 8 日消息,在人工智能领域,谷歌、OpenAI 以及其他科技巨头之间的竞争愈发激烈,留住顶尖人工智能人才成为了一大挑战。据 Business Insider 报道,谷歌旗下的人工智能部门 DeepMind,为防止员工流向竞争对手,竟采取了一种“激进”的竞业禁止协议。这种协议规定,部分在英国的员工在离职后一年内不得为竞争对手工作。在此期间,虽然员工无需工作,但 DeepMind

谷歌向 Pixel 9 /三星 Galaxy S25 推出 Gemini Live AI“实时拍摄”及识图导购助手功能

IT之家 4 月 8 日消息,谷歌宣布旗下 Gemini Live AI“Live Camera(实时拍摄)”及“Screenshare(识图导购)”功能现已支持 Pixel 9 系列手机和三星 Galaxy S25。之后还将支持更多安卓设备,不过只有付费的 Gemini Advanced 用户才能使用这些新功能。在启用“Live Camera”功能后,用户只需按下一个按钮即可激活“实时拍摄”功

亚马逊升级 AI 视频模型 Nova Reel,最长可生成两分钟多镜头视频

感谢IT之家网友 华南吴彦祖 的线索投递!IT之家 4 月 8 日消息,去年 12 月首次亮相的亚马逊 AI 视频模型 Nova Reel 迎来升级,其新版本 Nova Reel 1.1 能够生成时长最长可达两分钟的视频。据亚马逊网络服务(AWS)开发者倡导者伊丽莎白・丰特斯在博客文章中介绍,Nova Reel 1.1 能够生成具有“一致风格”的“多镜头”视频。用户可以提供长达 4000 个字

古尔曼:Siri“拖后腿”,苹果智能家居中心或推迟至明年推出

IT之家 4 月 8 日消息,据彭博社记者马克・古尔曼在其最新一期《Power On》通讯中披露,苹果公司备受瞩目的新一代智能家居中心指挥设备,原本有望在今年与消费者见面,如今却可能面临延迟,其发售日期将推迟到 2026 年。古尔曼指出,此次延迟的主要原因在于该设备所搭载的全新升级版 Siri 语音助手出现了“重大工程问题”。这款智能家居中心将主要通过语音进行操控,其功能高度依赖于 Siri 以

谷歌Gemini上线Deep Research功能,仅限付费订阅用户使用

4月9日消息,谷歌旗下AI平台Gemini迎来重要更新,其备受关注的“Deep Research”功能现已全面上线并得到显著增强。据悉,Gemini的Deep Research现已升级至Gemini2.5Pro实验模型,为用户提供更强大的研究支持。这一功能旨在通过AI驱动的深度分析,帮助用户快速整理复杂信息并生成详尽报告,进一步巩固Gemini在AI助手领域的竞争力。Deep Research功能

AI艺术风潮席卷吉卜力,学生们在创新与剽窃之间挣扎

近年来,吉卜力工作室风格的 AI 艺术作品在社交媒体上迅速传播,许多用户利用 AI 工具生成全新图像或重现已有照片,以展现这一日本动画工作室的独特风格。然而,这股热潮让人们不得不思考,欣赏与剽窃之间的界限究竟在哪里。自3月31日 OpenAI 为 ChatGPT 推出新功能,允许用户生成更加详细的照片后,AI 艺术的热潮随之而来。ASU 的太阳魔鬼健身中心等机构也参与其中,但很快便遭到了学生们的批

AI成媒体“毒药”?Quartz步后尘,低质内容致品牌陨落、编辑遭清洗

曾经备受尊敬的商业出版物Quartz,在经历了一段令人困惑且充斥低质量人工智能内容的时期后,最终被廉价出售,其编辑团队几乎全军覆没。这再次敲响了警钟,警示媒体行业盲目拥抱劣质AI可能带来的毁灭性后果。Quartz由其联合创始人扎克·西沃德(现任《纽约时报》AI计划负责人)在博客中回顾,自2012年以来已数次易手。上周,它再次被转卖给加拿大软件公司Redbrick,收购方同时还购入了商业网站The

IDC:端侧AI需求强劲,联想一季度增速领跑全球PC市场

根据国际数据公司(IDC)最新发布的报告,2025年第一季度全球个人电脑(PC)出货量同比增长了4.9%,总量达到6320万台。这一数据高于 IDC 在2月份的预测,显示出市场需求的强劲回升。其中,联想以24.1% 的市场份额稳居全球第一,同比增长1.3个百分点,并以10.8% 的增速成为前三大厂商中增长最快的公司。IDC 分析指出,第一季度 PC 的商业需求依然保持旺盛。这主要受到几个因素的推动

vivo 再度重组 AI 部门,明确新架构与职责

据雷锋网报道,vivo 于4月2日再次对其人工智能(AI)部门进行了重组,显示出其对 AI 领域持续的重视和改革决心。这一变化距上次调整不过一个月,说明 vivo 在 AI 战略上的探索仍在进行。此次重组中,vivo 撤销了原有的人工智能一部和人工智能二部,取而代之的是新的 AI 产品部、AI 技术开发一部和 AI 技术开发二部。每个新设部门都有明确的职责划分,以更好地适应市场需求和技术发展。AI

a16z 拟筹集200亿美元巨额基金,聚焦人工智能投资

近期,著名风险投资公司安德里森・霍洛维茨(Andreessen Horowitz,简称 a16z)宣布计划筹集一笔高达200亿美元的巨额基金,以支持美国人工智能(AI)初创企业的发展。这一消息引起了广泛关注,尤其是在当前全球对人工智能领域的投资热情高涨的背景下。消息来源透露,这笔资金将成为 a16z 历史上规模最大的基金,旨在利用全球投资者对美国 AI 公司的浓厚兴趣。随着人工智能技术的不断进步和

OpenAI呼吁欧洲加大AI基础设施投资,提升市场竞争力

最近,OpenAI 发布了一份针对欧洲联盟的经济蓝图,强调了在人工智能(AI)领域发展的四项重要原则。这份蓝图旨在引导欧洲国家更迅速地采取行动,利用 AI 所带来的经济潜力。OpenAI 指出,AI 的发展不仅能提高生产力,还有助于复兴欧洲经济竞争力,避免在全球竞争中落后。图源备注:图片由AI生成,图片授权服务商Midjourney在这份详细的经济计划中,OpenAI 提出了四个关键领域的建议:建

美国民众对人工智能的信任危机加剧

最近,皮尤研究中心发布的一项新报告显示,美国民众对人工智能的看法与行业专家之间存在明显的差距。该调查包含了超过1,000名人工智能专家和超过5,000名美国成年人,揭示出公众对这一技术的焦虑和不安日益加剧。图源备注:图片由AI生成,图片授权服务商Midjourney调查结果显示,约四分之三的人工智能专家认为,这项技术将对他们个人带来好处。而在公众中,只有四分之一的人持相同看法。专家们普遍认为人工智

三星或将于本周发布AI伴侣Ballie,智能家居新篇章即将开启

4月8日消息,据社交媒体平台上的最新消息和业内动态,三星有望在本周正式发布其备受期待的AI伴侣机器人Ballie。这款自2020年首次亮相以来多次迭代的球形机器人,被认为是三星智能家居生态的重要一环,可能为消费者带来全新的交互体验。Ballie最初于2020年CES展会上作为概念产品亮相,其独特的设计和AI驱动的功能引发广泛关注。经过多年的技术优化,三星在2025年CES上宣布Ballie将于今年

亚马逊推出革命性 AI 语音模型 Nova Sonic,价格更具竞争力!

亚马逊近日发布了其最新的 AI 语音模型 ——Nova Sonic,这一新技术标志着该公司在人工智能语音领域的重要进展。Nova Sonic 能够快速处理语音输入并生成自然流畅的语音输出,其在速度、识别准确性以及对话质量等方面已达到了与 OpenAI 和谷歌等行业领军企业的顶尖水平。与其他 AI 语音模型相比,Nova Sonic 在性价比方面表现突出,价格竟然比 OpenAI 的 GPT-4o

Docker化PDF布局分析服务发布,OCR、分段、分类与排序一站式解决

近日,一项名为“PDF Document Layout Analysis”的全新Docker化服务正式上线,标志着PDF文档解析技术迈向更高效、可扩展的新阶段。这一服务旨在通过智能算法和容器化部署,帮助用户快速分离和分类PDF文档中的文本、表格和图像等元素,为企业、开发者及研究人员提供便捷的解决方案。技术亮点:精准解析与高效部署该服务基于先进的机器学习模型开发,利用DocLayNet等专业数据集进

亚马逊推新一代AI语音模型Nova Sonic,捕捉语气、语调变化和节奏

亚马逊近日推出了一款新型 AI 语音模型 ——Nova Sonic,旨在提升其语音助手 Alexa + 的性能。Nova Sonic 被设计用于本地处理语音并生成自然流畅的回复,标志着亚马逊在语音识别技术领域的又一次突破。Nova Sonic 采取了一种全新的整合方式,将语音理解和生成的能力统一到一个模型中。这一创新不仅简化了语音应用的开发过程,还能根据语音输入的声学背景(如语调和风格)来调整生成

美图WHEE推出图像生成模型 Miracle F1 :风格多元更逼真

近日,WHEE 平台推出了全新的人工智能图像生成模型 Miracle F1,该模型以其极高的图像生成质量和对复杂概念的精准理解,为 AI 图像创作领域带来了新的突破。Miracle F1的一大亮点是其能够生成极具真实感的图像。它能够像摄影师一样理解物体的反光效果,像建筑师一样精准地计算空间透视关系,像画家一样捕捉光线流动的轨迹,从而实现了画面质感和语义理解的跨越式升级。通过智能模拟真实世界的光影和

AI视频生成技术TTT:可直出一分钟完整猫和老鼠动画 无需编辑、拼接

近日,一项名为《One-Minute Video Generation with Test-Time Training》(一分钟视频生成与测试时训练)的全新研究论文正式发布,标志着人工智能视频生成技术迈入了一个崭新阶段。该研究通过在预训练Transformer模型中引入创新的测试时训练(TTT)层,成功实现了生成一分钟《猫和老鼠》(Tom and Jerry)动画视频的壮举。这一技术不仅在时间跨度