预训练不等于更强大,研究揭示大语言模型的 “灾难性过度训练” 现象

近日,来自卡内基梅隆大学、斯坦福大学、哈佛大学和普林斯顿大学的研究人员揭示了一个关于大语言模型(LLMs)训练的新发现:并不是预训练的数据越多,模型的表现就越好。相反,他们指出,过度的预训练可能会导致模型性能下降,出现一种被称为 “灾难性过度训练” 的现象。在一项研究中,研究者们对 OLMo-1B 模型进行了比较,分别对其进行了2.3万亿和3万亿个标记的训练。出乎意料的是,虽然第二个模型接受了更多

“AI 教父”等发布联名公开信: OpenAI 重组背离初衷,呼吁监管介入

IT之家 4 月 24 日消息,科技媒体 The Decoder 昨日(4 月 23 日)发布博文,报道称前 OpenAI 员工、研究人员及非营利组织联名发表公开信,强烈呼吁监管机构阻止 OpenAI 提出的公司重组计划。OpenAI 成立于 2015 年,最初为非营利组织,旨在确保通用人工智能(AGI)开发与公共利益保持一致。公司为筹集资金,于 2019 年设立营利子公司 OpenAI LP,

共同阶跃星辰与原力灵机达成战略合作

阶跃星辰与原力灵机在北京签署了战略合作协议,双方将利用各自的技术优势,在多模态大模型技术、智能终端 Agent 和具身智能场景方面展开深入合作。此次合作的目标是实现 “实现在物理世界的推理”,共同开发一种名为 “RoboAgent” 的智能机器人,推动通用人工智能(AGI)在实际应用中的落地。签约仪式上,阶跃星辰的创始人兼 CEO 姜大昕博士和原力灵机的联合创始人范浩强共同见证了这一重要时刻。阶跃

​谷歌文档推出 AI 语音朗读新功能,将帮助你发现错误

谷歌文档(Google Docs)又推出了一项令人期待的新功能 —— 音频概述(Audio Overviews)。这一功能的目标是帮助用户通过听取文档的朗读来提高写作质量,同时也为忙碌的用户提供了便捷的多任务处理方式。音频概述能够将用户的文档内容朗读出来,帮助作者发现文本中的拼写错误和不自然的表述。很多时候,写作者对自己写的内容存在盲点,容易忽略一些小错误或者需要重新修改的地方。而这一新功能正是通

别再只玩ChatGPT了!OpenAI悄悄发布《构建 Agent 实战指南》 手把手教你打造智能体

OpenAI 最近悄悄发布了一份 《构建 Agent 实战指南》 (A practical guide to building agents),简直就是一份“AI 打工人”的养成手册!今天,老司机我就带你用最接地气、最有趣的方式,把这份官方秘籍给你扒个底朝天,让你也能轻松 Get 打造专属 AI Agent 的精髓!准备好了吗?发车!等等,Agent 到底是个啥玩意儿?跟普通软件有啥不一样?咱们先

Anthropic 推出 AI for Science 计划,助力生命科学研究者实现更快科学发现

AI 公司 Anthropic 于5月6日正式宣布启动其全新计划 ——AI for Science。这一项目旨在为选定的研究人员提供大量免费的 API 积分,以促进科学研究与发现的进展。Anthropic 认为,人工智能的先进推理和语言能力能够极大地加速科学进步。借助这些技术,研究人员可以更有效地分析复杂的数据,提出假设,设计实验,并清晰地传达研究成果。公司表示,AI 技术的运用将有助于缩短科学发

全球首款!Ainos AI 鼻成功植入ugo人形机器人,机器拥有“嗅觉”

人工智能气味数字化领导者 Ainos.宣布,其专有的 AI Nose 嗅觉模块已成功安装到日本顶级服务机器人公司 ugo, Inc. 开发的人形机器人上。此次于2025年4月9日完成的安装,标志着全球首个具备功能性嗅觉的机器人诞生,为机器人技术、人工智能和人机交互开创了全新纪元。图源备注:图片由AI生成,图片授权服务商MidjourneyAinos 的 AI Nose 系统整合了高精度气体传感器阵

Hugging Face 收购 Pollen Robotics,开启机器人新时代

在4月15日,知名开源大模型平台 Hugging Face 宣布收购 Pollen Robotics,正式迈入实体机器人领域。尽管具体交易条款尚未公布,但此次收购将使 Pollen Robotics 的大约20名员工加入 Hugging Face。这是该公司迄今为止规模最大的一次人员收购,表明其在扩展业务领域方面的雄心。Hugging Face 的联合创始人兼首席科学官 Thomas Wolf 表

英伟达震撼发布Llama 3.1 Nemotron Ultra 253B:AI性能王者再定义行业新标杆

近日,全球芯片与AI技术巨头英伟达(NVIDIA)推出了一款全新开源大语言模型——Llama3.1Nemotron Ultra253B,引发了人工智能领域的强烈反响。这一模型基于Meta的Llama-3.1-405B打造,通过创新技术优化,不仅在性能上超越了Llama4Behemoth和Maverick等强劲对手,还以高效的资源利用率和卓越的多任务能力,为AI应用的广泛落地提供了新的可能。Llam

1对1 AI全科家教!酷开AI学习机Y41 Air发布:1999元起

快科技4月23日消息,酷开AI学习机Y41 Air已经发布,官方号称1对1 AI全科家教,定价1999元,5月17日开售。据介绍,酷开AI学习机Y41 Air内置了酷开教育智能体,深度融合酷开灵耳、Deepseek、通义千问、豆包等大模型,设有从学龄前到K12的全阶段教育服务,语音、拍照都可解题真人式启发教学,孩子多维知识提升快。可以让学龄前儿童通过AI互动百科视频边看、边问、边学,还可以帮助

RAGEN – 训练大模型推理 Agent 的开源强化学习框架

RAGEN是什么RAGEN是开源的强化学习框架,用于在交互式、随机环境中训练大型语言模型(LLM)推理Agent。基于StarPO(State-Thinking-Action-Reward Policy Optimization)框架,通过多轮交互优化整个轨迹,支持PPO、GRPO等多种优化策略。RAGEN通过MDP形式化Agent与环境的交互,引入渐进式奖励归一化策略,有效解决了多轮强化学习

Genspark发布自动化AI代理Super Agent 具备自主思考、调用工具的能力

近日,人工智能领域迎来了一项引人注目的技术突破——Genspark正式推出了其全新自动化AI代理“Super Agent”。这一智能系统以其强大的自主思考、任务规划与执行能力,迅速成为行业焦点。据悉,Super Agent不仅在功能上与此前备受关注的Manus相媲美,还通过独特的“多智能体混合系统”(Mixture-of-Agents)设计,展现了在多样化场景下处理任务的卓越性能,为用户带来了从日

说个抽象的事,你现在可以在秘塔AI搜索里上课了。

声明:本文来自于微信公众号数字生命卡兹克,授权站长之家转载发布。给我整不会了。周末我本来在用秘塔AI搜关税的问题,特朗普一天一个说法,又说关税要结束了。然后,意外的发现,秘塔上了一个非常有意思的功能。“今天学点啥”。。。说实话,在进入到这个页面的瞬间,我以为我跳到不知道哪去了,直到看到秘塔左上角的logo还在,我才确定,这是他们的新功能。它的功能大概就是,把一份文件或者一个链接,变成一个像是B

YouTube 试水AI生成亮点视频,用户体验能否提升?

谷歌近日宣布将其 AI 概述功能扩展至 YouTube,推出算法生成的视频亮点和搜索建议。这项实验性工具目前只向美国的少量 YouTube Premium 用户开放,旨在帮助用户快速找到与购物和旅游相关的视频内容,而无需观看整段视频。在视频内容越来越丰富的今天,如何高效地发现所需信息变得尤为重要。谷歌表示,AI 生成的结果会自动识别并呈现最相关的片段,意在简化内容的发现过程。然而,这项新功能的推出

OpenAI 上线 Flex 处理模式:API 费用减半,但牺牲响应速度及稳定性

IT之家 4 月 18 日消息,据外媒 TechCrunch 今日报道,为在与谷歌等生成式 AI 竞争对手的较量中进一步加大投入,OpenAI 宣布推出“Flex 处理模式”新的 API 服务 —— 用户以接受响应速度变慢和“资源偶尔无法分配”为代价,换取更优惠的模型使用价格。OpenAI 表示,Flex 处理目前已对新近发布的 o3 和 o4-mini 推理模型开放测试,主要面向模型评估、数据

Eagle 2.5 – 英伟达推出的视觉语言模型

Eagle 2.5是什么Eagle 2.5是英伟达推出的视觉语言模型,专注于长上下文多模态学习的 AI 模型,参数规模仅为 8B。参数量较小,但在处理高分辨率图像和长视频序列方面表现出色,性能媲美参数量更大的 Qwen 2.5-VL-72B 和 InternVL2.5-78B。Eagle 2.5 采用创新训练策略:信息优先采样和渐进式后训练。信息优先采样通过图像区域保留和自动降级采样技术,确保

在线设计平台 Canva 新增多项 AI 技能:图片生成、互动编程、电子表格等

IT之家 4 月 11 日消息,在线设计平台 Canva 周四宣布计划向其平台添加一系列新 AI 功能,其中包括 AI 助手、通过指令生成应用的功能、电子表格支持以及 AI 驱动的编辑工具。名为 Canva AI 的 AI 助手能完成多种任务,不论是根据用户要求生成图像,还是提出社交媒体宣传资料或印刷样本等设计创意,其都能应对,还支持自动撰写文案和制作文档。借助 Canva Code 这一新工具

AI日报:ChatGPT重磅上线图像库功能;白嫖!Veo2登陆谷歌AI Studio;蚂蚁百宝箱推“MCP专区”

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、报道称字节跳动整合 AI 研发团队,AI Lab 即将并入 Seed字节跳动正在进行AI研发团队的整合,将独立的字节AI Lab并入Seed团队。这一举措体现了字节在AI领域

别玩吉卜力了,来看GPT-4o隐藏的8种高能玩法

声明:本文来自于微信公众号AI新榜,作者:Kino,授权站长之家转载发布。有图有真相的时代恐怕要彻底过去了,我们离“AI生成现实”越来越近了。注意看:这是一张印着伦敦某高档融合餐厅名的小票,菜单里有龙虾、牛排、Barolo酒,总金额£1500,还有服务员名字、小费、日期时间。排版真实、金额对齐、票据结构合理,纸张甚至有褶皱和阴影。来源:X@the_Lawrenz如果不是最后诈骗级别的£355.

Recraft 获 3000 万美元 B 轮融资,图像生成技术挑战行业巨头

初创公司 Recraft 近日宣布完成3000万美元的 B 轮融资。这轮融资由知名风险投资公司 Accel 领投,其他投资机构如 Khosla Ventures 和 Madrona 也参与其中。Recraft 总部位于美国旧金山,此前在2024年曾获得1200万美元的 A 轮融资,目前公司年化经常性收入已超过500万美元,并拥有400万注册用户。Recraft 推出的图像生成模型 “red_pan