百度Create AI开发者大会:李彦宏发布两大新模型、多款热门AI应用、开发者全面拥抱MCP

快科技4月25日消息,今日,Create2025百度AI开发者大会在武汉隆重举办。百度创始人李彦宏发表了题为《模型的世界 应用的天下》的演讲。60分钟的演讲中,李彦宏发布了两大模型,多款热门AI应用,并宣布将帮助开发者全面拥抱MCP。当天发布的文心大模型4.5 Turbo和深度思考模型X1 Turbo,能力更强、成本更低。相比文心4.5,文心大模型4.5 Turbo速度更快,价格下降80%。文

Meta 推 WebSSL 模型:探索 AI 无语言视觉学习,纯图训练媲美 OpenAI CLIP

IT之家 4 月 25 日消息,科技媒体 marktechpost 昨日(4 月 24 日)发布博文,报道称 Meta 公司发布 WebSSL 系列模型,参数规模从 3 亿到 70 亿,基于纯图像数据训练,旨在探索无语言监督的视觉自监督学习(SSL)的潜力。以 OpenAI 的 CLIP 为代表,对比语言-图像模型已成为学习视觉表征的默认选择,在视觉问答(VQA)和文档理解等多模态任务中表现突出

李彦宏发布文心大模型双星:X1Turbo 直指 DeepSeek,4.5Turbo 超越 GPT-4o

在百度 Create 开发者大会上,百度创始人李彦宏重磅发布了全新一代文心大模型 X1Turbo。这款模型在性能大幅提升的同时,价格极具竞争力,每百万 token 的输入价格仅为1元,输出价格为4元,仅相当于竞品 DeepSeek-R1的25%。据介绍,文心大模型 X1Turbo 基于4.5Turbo 的深度思考模型打造,不仅性能更优,还在思维链、问答、创作、逻辑推理、工具调用和多模态能力等方面实

苹果AI战略大调整:继Siri换帅后,神秘机器人团队划归硬件部门

科技巨头苹果公司近期对其人工智能(AI)部门进行了又一次重大调整。据知情人士透露,苹果计划在本月晚些时候将其秘密的机器人技术部门从AI主管约翰·詹南德里亚(John Giannandrea)的管辖范围中剥离,转交给硬件工程高级副总裁约翰·特努斯(John Ternus)领导。这次调整紧随今年三月将表现不佳的Siri语音助手业务从詹南德里亚手中移交之后。一系列变动凸显了苹果正努力追赶在AI领域领先的

​埃隆・马斯克的 xAI 在孟菲斯引发污染争议

埃隆・马斯克的人工智能公司 xAI 最近在田纳西州孟菲斯引发了争议。这家公司正在该地区建设一台巨大的超级计算机,以支持其业务运营。然而,自从去年夏天超级计算机投入使用以来,社区居民和环保活动家表示,该设施已成为当地主要的空气污染源之一。图源备注:图片由AI生成,图片授权服务商Midjourney针对这一问题,孟菲斯市健康部门已安排于周五举行首次公开听证会,以听取各方意见。在听证会前,一些匿名团体向

百度通用超级智能体“心响”上线,“秒哒”向全社会开放

近期,百度在人工智能领域再出新成果,正式推出多智能体协作应用“心响”,并加速推进“秒哒”的全民化应用,为人工智能应用的发展注入了新的活力。自去年11月百度世界大会推出“秒哒”以来,其无代码编程、多智能体协作、多工具调用的特性受到了广泛关注。今年3月,“秒哒”正式向全社会开放,让任何人都可以通过简单的语音指令或文字输入,快速生成应用。百度创始人李彦宏表示:“全球只有不到3000万程序员,而有80亿人

Skywork-R1V 2.0 – 昆仑万维开源的新版多模态推理模型

Skywork-R1V 2.0是什么Skywork-R1V 2.0 是昆仑万维最新开源的多模态推理模型,专为复杂推理任务设计,具备强大的视觉与文本推理能力。模型基于混合强化学习和多模态奖励模型(Skywork-VL Reward)实现推理能力与泛化能力的平衡,引入选择性样本缓冲区(SSB)机制解决“优势消失”问题。在 AIME2024、OlympiadBench 等权威基准测试中表现出色,性能

OpenAI 将 ChatGPT 新图像生成技术引入 API,每张图约 2 美分起

IT之家 4 月 24 日消息,OpenAI 于本周三宣布,将其 ChatGPT 中新升级的图像生成功能背后的技术引入 API,使开发者能够将这一功能集成到他们的应用程序和服务中。今年 3 月底,OpenAI 推出的新 ChatGPT 图像生成器因其能够创建逼真的吉卜力风格图片和“AI 人偶”而迅速走红。这一功能的推出吸引了数百万新用户注册 ChatGPT,也给公司的服务器容量带来了巨大压力。据

挑战第一方 Siri:Perplexity 在苹果 iOS 平台推出 AI 语音助手

IT之家 4 月 24 日消息,AI 企业 Perplexity 北京时间昨日宣布为旗下苹果 iOS 平台应用程序推出 AI 语音助手功能。这一第三方程序可在一定程度上实现近似苹果第一方 Siri 助手的使用体验。Perplexity 称其 AI 助手可通过网页浏览和多应用操作来执行用户语音中想要的操作,在介绍视频中这包括自动的地图搜索、餐厅预订、电子邮件草拟、提醒设置和媒体播放。广告声明:文内

OpenAI推ChatGPT新图像生成功能API:开发者可轻松集成 AI 绘图功能

OpenAI 在近日宣布,已将其最新的图像生成功能通过 API 开放给开发者,使其能够将这一先进的技术集成到各种应用和服务中。这一消息无疑为开发者们提供了一个新的机遇,特别是在图像处理和创作领域。新推出的图像生成模型名为 “gpt-image-1”,其背后支持了 ChatGPT 的图像生成技术。自今年3月底该功能上线以来,用户可以创建出逼真的吉卜力风格图片和各种 “AI 人偶”。这一功能在上线后迅

​OpenAI预测2029年收入激增至1250亿美元 2030年达30亿月活用户

OpenAI 近期发布了一项关于未来收入的预测,预计到2029年,其总收入将达到1250亿美元。其中,AI 代理业务和渠道收入将成为主要驱动力。根据预测,AI 代理业务将占总收入的近四分之一,预计收入将达到290亿美元,而渠道收入则预计达到250亿美元。图源备注:图片由AI生成,图片授权服务商Midjourney随着 ChatGPT 的成功,OpenAI 的收入在2023年达到了37亿美元,较前一

微软365Copilot新增研究员和分析师机器人,助力企业智能化

近日,微软对其365Copilot 进行了更新,推出了一系列新功能,包括 AI 驱动的企业搜索、推理代理和一个新的代理商店。一些用户已经可以体验到这些新功能,而其他用户可能需要等待到5月份才能使用。其中,AI 驱动的企业搜索备受关注。微软表示,Copilot 搜索将搜索与人工智能的力量结合起来,提供更相关、更具上下文意识的搜索结果。微软设计和研究部门的副总裁 Jon Friedman 在视频中解释

颠覆传统!海螺集团联手华为发布水泥建材业首个AI大模型,赋能产业智能化升级

近日,一场引领水泥建材行业变革的技术发布会吸引了业界的广泛关注。国内领先的水泥制造商海螺集团携手科技巨头华为,共同揭开了行业内首个人工智能大模型的神秘面纱。这不仅仅是一次简单的技术应用,更是对传统生产模式的一次深度革新。据悉,这款AI大模型是基于强大的华为云盘古系列大模型构建而成  。它并非纸上谈兵,而是深度融入了水泥生产的实际场景,全面覆盖了包括 质量控制、生产优化、设备维护、能耗管理以及安全环

英伟达推多模态LLM Describe Anything:指定特定区域生成详细的描述

NVIDIA AI团队发布了一款革命性的多模态大语言模型——Describe Anything3B(DAM-3B),专为图像和视频的精细化、区域化描述而设计。这款模型凭借创新技术和卓越性能,在多模态学习领域掀起热议,成为AI技术发展的又一里程碑。以下,AIbase为您梳理这款模型的核心亮点与行业影响。区域化描述的突破DAM-3B以其独特的能力脱颖而出:能够根据用户指定的图像或视频区域(如点、框、涂

昆仑万维开源Skywork-R1V 2.0版本 视觉与文本推理能力提升

4月24日,昆仑万维宣布正式开源其多模态推理模型Skywork-R1V2.0(以下简称R1V2.0)。这一升级版本在视觉与文本推理能力上均实现了显著提升,特别是在高考理科难题的深度推理和通用任务场景中表现出色,堪称当前最均衡兼顾视觉与文本推理能力的开源多模态模型。R1V2.0的开源,不仅是昆仑万维在多模态领域技术实力的体现,也为全球开发者和研究者提供了强大的工具,推动多模态生态建设。该模型在多个权

Google AI推出Mobility AI计划,赋能智能交通管理新未来

Google AI宣布推出Mobility AI计划,旨在为全球交通运输机构提供数据驱动的决策支持、交通管理和城市交通系统持续监控工具。据AIbase了解,该计划利用人工智能在测量、模拟和优化领域的最新进展,助力城市实现更安全、高效和可持续的交通网络。计划详情已通过Google AI官方渠道公布,引发了智能交通领域的高度关注。核心功能:AI驱动的交通管理与优化Mobility AI计划通过整合AI

全球首个集成大模型开发框架的区块链虚拟机正式开源

4 月 24 日,一款名为 DTVM(DeTerministic Virtual Machine)的区块链虚拟机宣布开源,在开发者社区引发热议。据其公开的技术论文显示,DTVM通过创新JIT引擎与全链路优化,IT引擎加速较传统解释执行实现约30倍的性能提升,刷新了目前行业最高水平,同时完全兼容以太坊生态,成为技术新标杆。区块链虚拟机是运行在区块链网络上的一个特殊计算环境,用于处理大量的计算和交易指

广告投放全流程自动化!超级汇川全新发布"AI智投"

随着消费者行为模式的多样化和媒体渠道的日益分散,数字营销行业面临挑战。传统人工数据分析效率低、误差率高,大幅制约广告预算效能。针对上述痛点,近期阿里巴巴旗下超级汇川广告平台推出“AI智投”信息流智能投放产品,基于AI大模型与实时数据分析技术,通过机器学习深度解析用户偏好,实时监控投放效果并自动优化策略,实现广告投放的动态精准调控,助力广告主提升投放ROI。   作为超级汇川广告平台智投版的“全周期

高考考上985的AI来了!超强数理推理横扫真题,训练秘籍剑指AGI

声明:本文来自于微信公众号 新智元,授权站长之家转载发布。就在刚刚,全球首个工业界多模态推理模型Skywork-R1V,再次重磅升级!此前,R1V1.0首次成功实现了「强文本推理能力向视觉模态的迁移」,才短短一个月后,Skywork-R1V2.0就强势上线了。现在,R1V2.0的所有资源已全面开源,可以预见,多模态推理社区将迎来新一轮发展。模型权重:https://huggingface.co

英伟达推 DAM-3B 模型:突破局部描述难题,让 AI 看懂图像 / 视频每一个角落

IT之家 4 月 24 日消息,科技媒体 marktechpost 昨日(4 月 23 日)发布博文,报道称英伟达为应对图像和视频中特定区域的详细描述难题,最新推出了 Describe Anything 3B(DAM-3B)AI 模型。视觉-语言模型(VLMs)在生成整体图像描述时表现出色,但对特定区域的细致描述往往力不从心,尤其在视频中需考虑时间动态,挑战更大。英伟达推出的 Describe