上海人工智能实验室开源多模态大模型“书生・万象 3.0”:能同时处理文本和多模态输入

IT之家 4 月 17 日消息,据上海人工智能实验室官方公众号,4 月 16 日,上海人工智能实验室(上海 AI 实验室)升级并开源了通用多模态大模型书生・万象 3.0(InternVL3)。官方介绍,通过采用创新的多模态预训练和后训练方法,InternVL3 多模态基础能力全面提升,在专家级基准测试、多模态性能全面测试中,10 亿~780 亿参数的全量级版本在开源模型中性能均位列第一,同时大幅

字节跳动发布豆包 1.5 深度思考模型,具备“看图思考”能力

IT之家 4 月 17 日消息,在今日火山引擎 AI 创新巡展杭州站现场,字节跳动旗下火山引擎总裁谭待发布了最新的豆包 1.5・深度思考模型。据介绍,该模型在数学、编程、科学推理等专业领域及创意写作等通用任务中表现突出。数学推理 AIME 2024 测试得分追平 OpenAI o3-mini-high,编程竞赛和科学推理测试成绩也接近 o1。在创意写作、人文知识问答等通用任务上,模型也展示出优秀

微软 Edge 浏览器免费上线 Copilot Vision 功能,AI 助手可实时解读屏幕内容

IT之家 4 月 17 日消息,微软人工智能首席执行官穆斯塔法・苏莱曼今天在 Bluesky 上宣布,微软的人工智能助手功能“Copilot Vision”现在可以在 Edge 浏览器中免费使用,该功能可以解读屏幕上的内容并帮助用户使用应用程序。据IT之家了解,“Copilot Vision”是一种“基于语音的体验”,用户可以通过语音指令与之交互。苏莱曼表示,当用户启用该功能时,“Copilot

5000 亿美元大项目版图扩张,消息称 OpenAI、软银考虑在英投资“星际之门”

IT之家 4 月 17 日消息,据英国《金融时报》今日报道,OpenAI 与软银主导的 5000 亿美元(IT之家注:现汇率约合 3.65 万亿元人民币)美国数据中心项目“星际之门”正在考虑未来在英国的投资,旨在全球范围内建立支撑 AI 强大模型所需的基础设施。根据三位接近该项目的知情人士透露,英国已成为其优先选择之一,与英国政府近期通过加大对 AI 行业投资的力度有关,尤其是为开发者提供更便捷

AI“立功”:谷歌去年封停了 3920 万个广告账号,超 2023 年三倍

IT之家 4 月 17 日消息,据外媒 TechCrunch 报道,当地时间周三,谷歌宣布去年封停了 3920 万个广告主的账号,数量超过了 2023 年的三倍。谷歌表示,借助大语言模型和通过识别诸如商业冒充、非法支付信息等信号,目前公司能够在广告投放前就暂停“大多数”广告账户。谷歌广告安全总经理亚历克斯・罗德里格兹在一次虚拟媒体圆桌会议上表示:“这些 AI 模型对我们至关重要,已经带来了不少显

微软最新报告教你“防诈”:如何避开 AI 生成的虚假招聘与诈骗网站

IT之家 4 月 17 日消息,据外媒 Neowin 报道,微软 16 日发布了最新一期《网络安全信号报告》,详细说明了如何应对当今网络安全领域中的新型威胁、诈骗及欺诈行为,并阐述了 AI 如何使开发恶意软件变得“比以往任何时候都更加容易”。微软指出,威胁行为者通过深度伪造、声音克隆、伪造员工档案以及假冒电商网站和产品图片等手段,正不断加大对潜在受害者的欺骗力度,IT之家附此内容大意如下:AI

“最佳 AI 拍档”合作裂痕初现:OpenAI 谋求独立、微软转向自研

IT之家 4 月 17 日消息,微软与 OpenAI 的合作,曾被誉为科技界最佳“兄弟情”。微软斥资数十亿美元,将 OpenAI 的 ChatGPT 技术深度融入其产品生态,然而近期迹象显示双方关系趋于紧张。合作裂痕初现,OpenAI 谋求独立OpenAI 在今年 2 月公布了价值 5000 亿美元的 Stargate 项目,计划在美国建设多个数据中心,以支持其 AI 研发,意味着 OpenAI

OpenAI 部署新监控系统,防范 o3 和 o4 - mini 提供生物和化学威胁建议

IT之家 4 月 17 日消息,人工智能公司 OpenAI 宣布部署了一套新的监控系统,专门用于监测其最新的人工智能推理模型 o3 和 o4-mini,防止这些模型提供可能引发生物和化学威胁的有害建议。根据 OpenAI 的安全报告,该系统旨在确保模型不会为潜在的有害攻击提供指导。据 OpenAI 表示,o3 和 o4-mini 相比之前的模型在能力上有显著提升,但同时也带来了新的风险。根据 O

可实时识别屏幕内容,谷歌 Gemini Live 功能向所有安卓用户免费开放

IT之家 4 月 17 日消息,谷歌今日宣布,其 Gemini 应用中的 Gemini Live 功能将免费向所有安卓用户开放。该功能能够实时识别并回应关于用户手机摄像头和屏幕上的内容,本月早些时候为所有 Pixel 9 和三星 Galaxy S25 用户推出,并且需要通过 Gemini Advanced 订阅才能使用。然而,谷歌在收到用户对 Gemini Live 功能的积极反馈后,决定改变策

在终端就能跑的轻量级推理智能体,OpenAI 发布完全开源 Codex CLI 工具

IT之家 4 月 17 日消息,OpenAI 今日发布了一款轻量级终端运行编码智能体 —— Codex CLI,该工具现已在 GitHub 完全开源。Codex CLI 可以直接在用户的计算机上工作,旨在最大化 o3 和 o4-mini 等模型的推理能力,并即将支持 GPT-4.1 等额外的 API 模型。用户可以通过命令行获得多模态推理的能力,比如通过传递截图或低保真草图给模型,并结合对本地代

消息称 OpenAI 考虑以 30 亿美元收购人工智能编程工具 Windsurf

IT之家 4 月 17 日消息,据彭博社报道,知情人士透露,OpenAI 正在就以约 30 亿美元(IT之家注:现汇率约合 219.67 亿元人民币)收购 Windsurf(一个人工智能辅助编程工具,原名 Codeium)进行谈判。如果此次收购成功,这将是 OpenAI 有史以来最大的一笔收购交易,也将有助于其在日益激烈的 AI 驱动编程助手市场中增强竞争力。此类编程助手系统能够根据自然语言提示

阿里AI模型获FDA认定“突破性医疗器械”

近日,阿里巴巴的 AI 模型 DAMO PANDA 获得了美国食品和药物管理局(FDA)的 “突破性医疗器械” 认证。这一成就标志着阿里巴巴在胰腺癌早期筛查领域取得了重大突破,为该疾病的早期诊断提供了新的可能性。DAMO PANDA 是阿里巴巴达摩院研发的一款专注于胰腺癌筛查的 AI 模型。其主要功能是通过分析平扫 CT 影像,精准识别出人眼难以察觉的细微病灶。这项技术的推出,旨在解决胰腺癌早期筛

Scout AI 成功筹集 1500 万美元种子资金

Scout AI,这家专注于无人驾驶车辆制造和自主软件开发的初创公司,近日宣布成功完成1500万美元的种子融资,正式从隐秘模式中浮出水面。该公司由 Colby Adcock 和 Collin Otis 于去年8月创立,旨在将人工智能(AI)和机器人技术结合应用于国防任务。在融资宣布的当天,Scout AI 自豪地透露他们已获得多项美国国防部的合同,并推出了其旗舰产品 —— 名为 Fury 的视觉

人工智能助力医疗行业新发展:Hellocare.ai、SignalFire 等公司获重大融资

近期,健康科技行业迎来了多笔重要融资,显示出人工智能在医疗领域的快速崛起和广泛应用。其中,早期风险投资公司 SignalFire 成功筹集了10亿美元资金,旨在支持以人工智能为核心的初创企业。这笔资金的募集使得 SignalFire 的管理资产总额达到了30亿美元,突显了其在行业中的重要地位。SignalFire 的投资组合包括多家医疗初创公司,如 Grow Therapy 和 Health Go

Reachy 2开源人形机器人正式开售 售价7万美元

近日,Pollen Robotics推出其最新开源人形机器人Reachy2,正式开启销售,定价为7万美元。据AIbase了解,这款机器人已在Cornell大学、Carnegie Mellon大学及多家顶级AI实验室投入使用,成为机器人研究与教育领域的先锋。Reachy2以其模块化设计、开源架构和强大的AI驱动能力,吸引了全球研究机构与开发者的关注,为人形机器人领域树立了新标杆。核心优势:仿人形态与

企业需拥抱 “B2AI” 时代:与AI代理人的新型商业模式

随着人工智能(AI)的快速发展,商业模式也在悄然发生变化。过去我们熟悉的 “B2C”(企业对消费者)和 “B2B”(企业对企业)模式,正在迎来一个全新的概念 ——“B2AI”(企业对 AI)。根据 Visa 与未来研究所的最新报告,这一转变可能会对商业和个人金融产生深远的影响。报告指出,虽然许多人尚未普遍使用个人 AI 工具,但这些技术已经悄然进入市场。就像企业为了吸引消费者而调整搜索引擎优化(S

字节发布豆包1.5深度思考模型:多模态深度思考、延迟低

在4月17日的火山引擎 AI 创新巡展杭州站上,字节跳动旗下的火山引擎总裁谭待正式发布了最新的豆包1.5・深度思考模型。此次发布会吸引了众多行业人士的关注,谭待在会上分享了该模型在多个领域的优异表现。据悉,豆包1.5模型在数学、编程、科学推理等专业领域,以及创意写作等任务中,都展现出了卓越的能力。这款新模型采用了 MoE(混合专家)架构,总参数达200亿,而激活参数仅为20亿,显著低于行业同类模型

​OpenAI 新系统阻断生物和化学风险信息,保障 AI 安全

OpenAI 近期推出了一项新系统,旨在监控其最新的 AI 推理模型 o3和 o4-mini,以阻止与生物和化学威胁相关的提示。该系统的目标是防止模型提供可能教唆他人实施有害攻击的建议,确保 AI 的安全性。OpenAI 表示,o3和 o4-mini 在能力上较之前的模型有显著提升,因此在恶意用户手中可能带来新的风险。根据 OpenAI 的内部基准测试,o3在回答关于某些生物威胁的相关问题时,表现

AI音乐时代来临:Deezer平台上18%的新曲由人工智能创作

据法国流媒体平台 Deezer 最新公布的数据,约18% 的上传歌曲完全由人工智能生成,这一比例显示出 AI 在音乐创作领域的广泛应用与日俱增。数据显示,每天有超过20,000首 AI 生成的曲目被上传到该平台,几乎是四个月前的两倍。Deezer 的创新负责人 Aurelien Herault 指出,AI 生成内容的数量持续涌入流媒体平台,而且没有减缓的迹象。他还提到,该公司在一月份推出了一种检测

​Gartner报告显示:2027年,任务特定AI将超越通用AI

近日,Gartner 发布了一份新报告,指出到2027年,企业将使用任务特定的人工智能模型的频率是通用大型语言模型的三倍。报告中提到,虽然通用的语言模型在语言处理方面具有强大的能力,但在需要深入理解特定业务领域的任务中,它们的响应准确性却会下降。因此,越来越多的企业开始关注定制化的 AI 模型,以满足其特定需求。图源备注:图片由AI生成,图片授权服务商MidjourneyGartner 的副总裁兼