GPT-4.1 模型遭遇质疑:对齐性和稳定性引发关注

近日,OpenAI 推出了其新一代人工智能模型 ——GPT-4.1,声称在遵循用户指令方面表现优异。然而,令人意外的是,多项独立测试的结果显示,GPT-4.1的对齐性和稳定性较之前的版本有所下降,尤其是在处理敏感话题时的表现不尽如人意。牛津大学的研究科学家 Owain Evans 指出,经过不安全代码微调的 GPT-4.1在应对性别角色等敏感问题时,给出的回应存在更高的不一致性,这一现象在其前代模

售价将超万元!Meta计划推出高端AI眼镜:首次配售腕带控制器

快科技4月3日消息,近日,据媒体报道,Meta计划最快在今年年底推出智能眼镜系列中一款更高端的版本,内部代号为Hypernova”。该产品将内置更清晰的单眼显示屏并升级摄像头等配套设备,预计其售价将超过1000美元(约合人民币7270元),甚至有可能达到1400美元(约合人民币1.02万元)。有内部人士表示,屏幕升级是这款眼镜价格出现显著上涨的主要原因。该款眼镜将显示一个位于右镜片右下角区域的

小巧却强大!IBM发布新语言模型Granite 4.0 Tiny Preview:长上下文处理

IBM 发布了 Granite4.0Tiny Preview,这是即将推出的 Granite4.0系列语言模型中最小的一款的预览版本。该模型不仅具备高效的计算能力,还为开源社区提供了一个值得关注的实验平台。高效的性能与极小的内存需求 Granite4.0Tiny 在 FP8精度下,能够在消费级硬件上运行多个长上下文(128K)的并发任务,适用于市面上价格低于350美元的 GPU。尽管该模型目前仅经

NoteLLM – 小红书推出的笔记推荐多模态大模型框架

NoteLLM是什么NoteLLM 是小红书推出的针对笔记推荐的多模态大型语言模型框架。NoteLLM 基于生成笔记的压缩嵌入和自动生成标签类别,用大型语言模型(LLM)的强大语义理解能力,结合对比学习和指令微调技术,提升笔记推荐的准确性和相关性。NoteLLM-2 在NoteLLM基础上引入多模态输入,基于端到端微调策略,结合视觉编码器和 LLM,解决视觉信息被忽视的问题。NoteLLM-2

选 AI 比选对象还难!“起名黑洞”OpenAI 的新模型,到底怎么选?

一句话看懂:o3 以深度推理与工具调用能力领跑复杂任务,GPT-4.1 超长上下文与精准指令执行适合 API 开发,而 o4-mini 则堪称日常任务的「性价比之王」。如果你最近关注 AI 新闻,可能会被各种层出不穷的新模型搞得眼花缭乱。尤其是堪称「起名黑洞」的 OpenAI,命起名来可谓是毫无章法。即便是 AI 圈的资深团队,在面对同时发布的 o3、o4-mini、GPT-4.1、GPT-4.

国行版iPhone即将变身AI手机:iOS 18.5正式版已在路上

快科技4月25日消息,据媒体报道,经过将近一个月的测试,苹果将在5月份推送iOS 18.5正式版。该版本将为国行版iPhone带来Apple智能,目前美版、欧版iPhone都已上线Apple智能,但国行版iPhone仍然缺席。据悉,Apple智能(Apple Intelligence)是一种基于个人场景的生成式AI系统,能提供协助辅助、图像创作等智能化功能。具体来说,Apple智能涵盖了一系列

xAI推出Grok Vision,开启视觉与多语言智能交互新篇章

xAI宣布为其旗舰AI助手Grok推出全新Grok Vision功能,标志着Grok在多模态交互领域的重大突破。据AIbase了解,Grok Vision通过智能手机摄像头实时分析现实世界的物体、文本和环境,并结合多语言语音支持与实时搜索功能,为用户提供无缝的智能交互体验。相关细节已在xAI官网与社交平台公布,引发了全球AI社区的广泛热议。核心功能:视觉分析与多语言语音无缝融合Grok Visio

Ray-Ban Meta 智能眼镜正式推出实时翻译功能,支持四种语言和离线使用

IT之家 4 月 24 日消息,Meta 公司今日宣布,将向所有 Ray-Ban Meta 智能眼镜用户推出一项全新的实时翻译功能。此前该功能仅以测试版的形式向部分早期体验用户开放,如今正式面向广大用户推出。据IT之家了解,该实时翻译功能支持英语、法语、意大利语和西班牙语四种语言,用户可以在对话中实时将这些语言相互翻译。只要提前下载了相应的语言包,即使没有 Wi-Fi 或移动网络连接,用户也能够

AI正在触发一场身份革命 | 李檬相对论

声明:本文来自于微信公众号 李檬,作者:李檬,授权站长之家转载发布。2025年的今天,每个人都可以拥属于自己的“AI分身”。起初,AI只是你的“技能容器”,比如电视台已经广泛启用AI主播,可以实现24小时不间断播报新闻,错误率仅是人类主播的1/20。比如乌克兰女孩Olga Loiek意外发现,自己在中国被克隆了,而且批量生成了多个带货账号,这些数字分身在电商平台卖出数万美元产品,其中还有“俄罗

香港与英国研究团队提出创新图像标记化方法 分层结构提升重建质量

一组来自香港和英国的研究人员近日提出了一种新型图像标记化方法,旨在以更紧凑、更精确的方式将图像转换为数字表示(即令牌)。与传统方法将信息均匀分布于所有标记中不同,该方法采用分层结构,逐层捕捉视觉信息,从而提升了图像重建的质量和效率。传统的图像标记化技术通常会将图像的每个部分均等地划分为多个标记,而新方法则采取了分层结构。最初的标记会编码大致的形状和结构元素,而后续的标记则逐渐添加更精细的细节,直到

IDC:到2028年中国人工智能投资将突破1000亿美元

国际数据公司(IDC)发布了《全球人工智能和生成式人工智能支出指南》,预计到2028年,中国人工智能总投资将突破1,000亿美元,年均复合增长率达到35.2%。根据 IDC 的数据显示,2024年全球人工智能 IT 总投资预计为3,158亿美元,至2028年将增至8,159亿美元,年均复合增长率为32.9%。而在生成式 AI 方面,全球市场将在未来五年内以63.8% 的速度增长,到2028年市场规

​人工智能开发平台Hugging Face 收购 Pollen Robotics,加速开源机器人发展

人工智能开发平台Hugging Face宣布收购法国机器人初创公司Pollen Robotics,交易金额未披露。此举标志着Hugging Face首次进军硬件领域,旨在推动开源机器人技术在全球的普及与发展。Pollen Robotics成立于2016年,总部位于法国波尔多,以开发开源人形机器人Reachy2闻名。该机器人定价约7万美元,已被美国康奈尔大学和卡内基梅隆大学等研究机构采用,用于探索机

丰田携手 Gorilla 打造智能仓储解决方案

丰田汽车在泰国的物料搬运仓储解决方案部门宣布与 AI 安全与网络智能提供商 Gorilla 达成合作,共同开发智能仓库自动化工具。此次合作将 Gorilla 的人工智能解决方案与丰田在物流和物料搬运方面的专业知识相结合,旨在创造新的智能工厂创新。这些工具将帮助解决日常运营中遇到的实际问题,如 “错误的零件请求、仓库效率低下和高昂的工作延误成本”,从而将智能技术引入仓库环境。这一系统最初将在泰国推出

顺丰同城:已与豆包、腾讯混元等多个厂商达成合作

近日,顺丰同城宣布,将在各个业务环节全面推进运营数字化和人工智能(AI)决策的智能化。公司希望借此建立一个更适合即时配送行业的大型模型基础设施,以实现更高效的运营和服务。为了实现这一目标,顺丰同城依托 DeepSeek 的开源生态系统及其多模态 AI 能力,能够快速进行定制化开发。这意味着,顺丰同城可以根据不同客户的具体需求,迅速调整其服务和产品,以满足市场的多样性。这种灵活性大大缩短了项目的落地

联想发布三大AI服务品牌“擎天、百应、想帮帮”,全面抢滩AI服务市场

近日,联想中国区FY25/26财年誓师大会在北京隆重举行。大会上,联想集团执行副总裁兼中国区总裁刘军正式发布了联想全新的三大AI服务品牌:联想擎天、联想百应与想帮帮。刘军强调,此次三大品牌的发布标志着联想将全面进军AI服务领域,覆盖政企、中小企业和消费客户三大市场。图源备注:图片由AI生成,图片授权服务商Midjourney本次发布中,联想擎天解决方案与服务和想帮帮均为首次公开亮相。联想擎天专注于

粉笔AI荣获中国AIGC产业峰会2025值得关注AIGC产品奖

在近日举行的第三届中国 AIGC 产业峰会上,粉笔 AI 凭借其在职业教育领域的突出表现,荣获 “2025年值得关注的 AIGC 企业” 和 “2025年值得关注的 AIGC 产品” 两项大奖。此次峰会由量子位主办,主题为 “万物皆可 AI”,吸引了众多科技和教育行业的专家和从业者。粉笔的 CTO 陈建华在峰会上发表了题为《智能教育的重塑与实践:大模型的落地之路》的演讲。他深入探讨了大模型技术在教

OpenAI 新推出的 GPT-4.1 模型面临对齐性下降的挑战

近期,OpenAI 发布了其最新的人工智能模型 GPT-4.1,声称该模型在执行指令方面表现优秀。然而,多项独立测试却显示,GPT-4.1在对齐性,即可靠性方面,相较于前代模型 GPT-4o 有所下降。通常,OpenAI 会在发布新模型时附上详细的技术报告,包含安全评估的结果。但此次却没有遵循这一惯例,OpenAI 解释称,GPT-4.1不属于 “前沿” 模型,因此不需发布单独的报告。这一决定引起

OpenAI发布gpt-image-1 API,4o图像生成能力正式开放

OpenAI正式推出gpt-image-1API,标志着其备受瞩目的4o图像生成能力向开发者开放。据AIbase了解,这一API以其高保真图像生成、多样化视觉风格与强大的世界知识整合能力,被社区誉为“世界最强生图”工具。发布消息迅速在AI开发者与创意社区中引发热烈反响,相关文档已通过OpenAI官网与Playground平台公开。核心功能:高保真与多样化风格生成gpt-image-1API基于Op

Hugging Face上周最受欢迎模型榜单揭晓,AI创新热潮持续升温

Hugging Face近日公布了2025年4月第二周最受欢迎模型榜单,涵盖文本生成、图像生成到视频生成等多模态领域,凸显了AI技术的快速迭代与多元化应用。据AIbase了解,本次榜单中的模型不仅展示了开源社区的创新活力,还反映了从低精度训练到多模态生成的技术趋势。以下为榜单亮点解析,AIbase编辑团队为您带来专业解读。文本生成模型:高效与专业化并重  microsoft/bitnet-b1.5

谷歌研究揭示:合成数据提升大模型逻辑推理能力八倍

在最新的研究中,谷歌与卡内基梅隆大学及 MultiOn 团队联手,探讨了合成数据对大型模型的训练效果。他们发现,合成数据能够显著提升大模型在逻辑推理方面的表现,尤其是在数学问题的解决能力上,提升幅度达到了惊人的八倍。这一发现对于当前训练数据日益匮乏的现状具有重要的意义。目前,全球可用的高质量文本训练数据约为300万亿条,但随着像 ChatGPT 这样的模型日益普及,对训练数据的需求急剧增加,预计到