阿里开源多模态模型Qwen2.5-Omni:显存大幅降低暴降 50%

在开源大模型的竞争中,阿里巴巴推出了其最新的多模态模型 Qwen2.5-Omni-3B。这款模型的显著特点是显存使用减少了50%,在同等处理能力下,更加适合普通消费者的 GPU 设备。这一创新标志着阿里在多模态人工智能领域的进一步突破。Qwen2.5-Omni 是一款端到端的多模态模型,能够同时处理文本、图像、音频和视频等多种信息类型。得益于其独特的 “Thinker-Talker” 架构,模型能

​2025 年 Q1 中国 AI 耳机市场爆发式增长,销量同比猛增 960.4%

中国 AI 耳机市场在2025年第一季度迎来了一次前所未有的增长。据洛图科技的线上监测数据显示,这一季度 AI 耳机在传统主流电商平台的销量达到38.2万副,较去年同期增长了惊人的960.4%。这一现象不仅表明市场需求的强劲,也反映出生成式 AI 技术的迅猛发展,推动了智能硬件产品的不断涌现。图源备注:图片由AI生成,图片授权服务商MidjourneyAI 耳机的多种智能功能,使其备受用户青睐。这

网页版 Claude AI 酝酿升级:将支持 MCP 定制链接,扩展第三方服务集成

IT之家 5 月 1 日消息,科技媒体 testingcatalog 今天(5 月 1 日)发布博文,报道称 Anthropic 旗下 Claude 网页应用将突破谷歌服务的限制,正计划通过 MCP 扩展定制集成支持。IT之家注:MCP 全称为 Model Context Protocol,直译过来为模型上下文协议,由 Anthropic 于 2024 年 11 月底推出的开放标准,目标是统一大

谷歌 Gemini AI 酝酿新高级订阅层级,Ultra 蓄势待发

IT之家 5 月 1 日消息,科技媒体 testingcatalog 今天(5 月 1 日)发布博文,报道称谷歌计划扩展 Gemini AI 服务,可能扩展推出“Gemini Ultra”订阅层级。IT之家援引博文介绍,谷歌目前通过 Google One AI Premium 计划的,推出“Gemini Advanced”订阅层级,月费 19.99 美元,涵盖 Gemini 2.5 Pro 等先

DeepSeek-Prover-V2 登场:AI 数学推理新王者,88.9% 通过率设新标杆

IT之家 5 月 1 日消息,深度求索(DeepSeek)昨日(4 月 30 日)在 AI 开源社区 Hugging Face 上,发布名为 DeepSeek-Prover-V2-671B 的新模型,随后在 GitHub 等平台上公布了论文信息。IT之家援引论文介绍,DeepSeek-Prover-V2 是一款专注于形式化数学推理的开源大型语言模型,基于 DeepSeek-V3-0324,通过递

阿里通义千问 2.5-Omni-3B AI 全模态登场:7B 版 90% 性能,显存占用减少 53%

IT之家 5 月 1 日消息,阿里巴巴持续发力 AI 领域,其 Qwen 团队于 3 月发布 Qwen2.5-Omni-7B 模型后,昨日(4 月 30 日)再次发布 Qwen2.5-Omni-3B,目前可以在 Hugging Face 上开放下载。IT之家注:这款 3B 参数模型是其 7B 旗舰多模态模型的轻量版本,专为消费级硬件设计,覆盖文本、音频、图像和视频等多种输入功能。团队表示,尽管参

GPT4o生成的烂自拍,反而比我们更真实。

声明:本文来自于微信公众号 数字生命卡兹克,作者:数字生命卡兹克,授权站长之家转载发布。我是没想到,GPT4o用一段小小的Prompt生成的一些图片,引发的热度浪潮。能有这么长久,现在依然不断冒出着,各种创意。我相信无数人都在社交平台里,刷到过这些图。比如京东外卖跟美团外卖干架干的热火朝天。但是强子跟兴哥,却穿着各自的工服,在上海外滩友好自拍,虽然兴哥看着有点不嘻嘻。周杰伦和林俊杰、陈奕迅,也

快手正式成立可灵AI事业部 可灵AI半年收入破亿

快科技4月30日消息,快手宣布正式成立可灵AI事业部,负责可灵、可图等系列大模型业务。根据快手的组织架构调整公告,可灵AI事业部为公司一级部门,下设成立可灵AI产品部、运营部和技术部。据悉,快手高级副总裁盖坤将担任可灵AI事业部负责人,继续兼任社区科学线负责人,向快手科技创始人兼CEO程一笑汇报。2023年,快手启动AI战略,研发多模态大模型。而除了视频大模型可灵,快手还发布过1750亿参数规

英伟达CEO黄仁勋造访白宫:希望特朗普修改AI芯片出口规则

快科技5月1日消息,据媒体报道,美国当地时间周三, 英伟达公司首席执行官黄仁勋造访白宫时表示,他希望特朗普政府修改从美国向全球出口人工智能(AI)技术的相关法规,以便美国企业能更好地抓住未来的机遇。我们需要加速美国AI技术在全球的扩散,”黄仁勋在与媒体的简短会面中表示,政府的政策和鼓励措施必须真正支持这一点。”与此同时,黄仁勋还呼吁美国政府放宽人工智能图形处理单元出口规定,但媒体报道特朗普政府

电台用AI DJ当主持人:6个月无人识破!

快科技4月30日消息,澳大利亚知名电台CADA使用AI语音生成器ElevenLabs打造了一位AI DJ Thy。Thy自2024年11月开始主持节目《Workdays with Thy》,其表现如此逼真,以至于在长达六个月的时间里,竟然没有听众发现他并非人类。ElevenLabs的基本原理是,用户只需上传一段录音,ElevenLabs就能生成对应的语音模型,随后输入文字,AI就能用该声音将文