大模型

GPT-4.1偷偷开跑?神秘模型上线三天已被玩疯,网友发现大量OpenAI痕迹

声明:本文来自微信公众号“量子位”,作者:克雷西,授权站长之家转载发布。上线仅三天的神秘模型,已经鲨疯了!大模型聚合平台OpenRouter新推出的Optimus Alpha,已经处理了772亿Token,平均每天超过200亿。并且这个数字还在上升,日Token处理已超过340亿,排名第二,并在Trending榜单上位列第一。有网友试着用它挑战MC-Bench,生成《我的世界》风格的场景,并对

全球增长最快!DeepSeek月访问量超ChatGPT:份额世界第三

快科技3月31日消息,今日,据AI分析平台aitools.xyz,国产大模型DeepSeek已经成为全球增长最快的AI工具,其每月新增网站访问量已超过OpenAI的ChatGPT。报告称,2025年2月,DeepSeek访问量达到5.25亿次,超过ChatGPT5亿次。目前,DeepSeek市场份额6.58%,全球排名第三,仅次于ChatGPT和Canva,二者分别占比43.16%和8.27%

银行科技转型加速,大模型应用深入核心业务

随着银行业在数字化型中面临的挑战与压力日益加大,越来越多的银行开始将大模型技术融入到核心业务中,而不仅仅停留在简单的聊天机器人应用上。最新的财报数据显示,国内一些主要银行在科技投入和大模型应用方面取得了显著进展,但同时也显露出投入的分化趋势。根据钛媒体 App 对十家主要银行的分析,包括六大国有银行及几家股份制银行,发现其中六家银行的科技投入出现了缩减。例如,建设银行的科技投入为244.33亿元,

月之暗面 Kimi 推出首个内容社区,开启用户互动新模式

月之暗面近日宣布正在进行其首个内容社区产品的灰度测试,旨在提升用户体验和留存率。这款名为 Kimi 的产品早在去年底就开始了小范围的试用,目前终于迎来了更广泛的测试阶段。据澎湃新闻报道,月之暗面是一家成立于2023年3月的公司,由有着清华背景的杨植麟团队领导。创始团队的核心成员曾参与多个知名大模型的研发,包括 Google 的 Gemini 和 Bard 等。去年10月,该公司推出的 Kimi 智

快手正式成立可灵AI事业部 可灵AI半年收入破亿

快科技4月30日消息,快手宣布正式成立可灵AI事业部,负责可灵、可图等系列大模型业务。根据快手的组织架构调整公告,可灵AI事业部为公司一级部门,下设成立可灵AI产品部、运营部和技术部。据悉,快手高级副总裁盖坤将担任可灵AI事业部负责人,继续兼任社区科学线负责人,向快手科技创始人兼CEO程一笑汇报。2023年,快手启动AI战略,研发多模态大模型。而除了视频大模型可灵,快手还发布过1750亿参数规

学术打假!清华上交大研究颠覆认知:强化学习竟是大模型推理的"绊脚石"

【研究颠覆】清华大学与上海交通大学联合发表的最新论文,对业界普遍认为"纯强化学习(RL)能提升大模型推理能力"的观点提出了挑战性反驳。研究发现,引入强化学习的模型在某些任务中的表现,反而逊色于未使用强化学习的原始模型。【实验验证】研究团队在数学、编码和视觉推理三大领域进行了系统性实验:数学任务:在GSM8K、MATH500等基准测试中,RL模型在低采样次数(k值)下准确率提升,但在高k值时问题覆盖

Llama 4大模型跌落神坛:作弊刷榜、代码能力极差、和DeepSeek比就是伪开源

4月8日消息,被寄予厚望的美国Meta公司的最新开源大模型Llama 4发布不到2天时间,口碑急转直下,被质疑为刷榜作弊实际效果差、开源条件多部署门槛高是伪开源等。今天,大模型评测平台LM Arena亲自下场发文,打脸Meta提供给平台的Llama 4是“特供版”。据知情人士爆料称,Meta因面临DeepSeek、Gemini等竞品的快速迭代压力,选择“仓促发布未完成优化的模型”,牺牲技术严谨

华晨宝马与字节跳动火山引擎合作,推动AI赋能汽车营销

近日,华晨宝马领悦数字信息技术有限公司(“领悦”)与字节跳动旗下火山引擎达成合作,双方将在人工智能(AI)技术的帮助下创新汽车营销服务。此次合作通过AI技术实现精准的产品匹配与购车建议,优化内容引导,提升用户购车体验及经销商运营效率。宝马集团大中华区总裁高翔表示,AI是宝马打造更智能、贴心出行解决方案的关键,正在加速融入研发、生产、供应链、产品、服务及运营各个环节。“此次合作将推动营销模式的创新,

飞桨3.0正式发布,支持文心4.5等大模型,跨芯片适配成本降80

百度旗下的深度学习平台飞桨近日宣布正式发布新一代飞桨框架3.0。此次发布的框架3.0引入了五大核心技术创新,包括“动静统一自动并行”等关键技术,旨在有效降低大模型开发和训练成本,助力大模型时代的基础设施建设。作为支撑大模型训练和推理任务的核心基础设施,飞桨框架3.0在性能优化方面表现出色。该框架已经支持包括文心4.5、文心X1在内的多款主流大模型,并通过优化的DeepSeek-R1满血版单机部署,

商汤大装置SenseCore 2.0全新升级 推出1亿元代金券计划

4月14日,在北京举办的2025商汤技术交流日上,商汤科技正式宣布其大装置SenseCore2.0全面升级。作为AI基础设施领域的领军者,商汤大装置SenseCore2.0致力于为企业提供敏捷、灵活、可靠的全栈AI基础设施服务,以极致性价比推动大模型技术的高效落地与规模化应用。商汤大装置SenseCore2.0的升级,旨在应对当前大模型产业面临的三大挑战:开源模型和工具的主流化、性价比的生死线以及