D-DiT – 耶鲁大学联合字节Seed等机构推出的多模态扩散模型

D-DiT是什么D-DiT(Dual Diffusion Transformer)是卡内基梅隆大学、耶鲁大学和字节跳动Seed实验室推出的多模态扩散模型,能统一图像生成和理解任务。模型结合连续图像扩散(流匹配)和离散文本扩散(掩码扩散),基于双向注意力机制同时训练图像和文本模态。D-DiT能实现文本到图像生成和图像到文本生成的双向任务,支持视觉问答、图像描述生成等多种应用。模型基于多模态扩散T

NoteLLM – 小红书推出的笔记推荐多模态大模型框架

NoteLLM是什么NoteLLM 是小红书推出的针对笔记推荐的多模态大型语言模型框架。NoteLLM 基于生成笔记的压缩嵌入和自动生成标签类别,用大型语言模型(LLM)的强大语义理解能力,结合对比学习和指令微调技术,提升笔记推荐的准确性和相关性。NoteLLM-2 在NoteLLM基础上引入多模态输入,基于端到端微调策略,结合视觉编码器和 LLM,解决视觉信息被忽视的问题。NoteLLM-2

Amazon Nova Premier – 亚马逊推出的多模态AI模型

Amazon Nova Premier是什么Amazon Nova Premier 是亚马逊推出功能最强大的多模态 AI 模型,能处理文本、图像和视频输入(不包括音频),擅长处理需要深度理解上下文、多步骤规划以及跨多工具和数据源精确执行的复杂任务。支持高达100万token的上下文长度,可处理超长文档或大型代码库。 Nova Premier 可作为教师模型,通过 Amazon Bedrock

苹果探索在浏览器中加入AI搜索功能

站长之家(ChinaZ.com)5月8日 消息:苹果公司高级副总裁埃迪·库伊近日公开表示,公司监测到4月浏览器端搜索量出现历史性下滑,并透露苹果正加速推进浏览器AI搜索功能的研发。行业分析指出,苹果若在Safari等原生浏览器中集成AI搜索能力,将直接冲击搜索引擎市场现有格局。传统搜索引擎依赖关键词匹配,而AI技术可通过语义分析精准捕捉用户意图,显著提升信息检索效率与结果相关性。这种技术代际差

苹果高管称iPhone十年内恐被淘汰 AI迭代速度远超预期

据彭博社5月6日报道,在谷歌与美国司法部反垄断案庭审期间,苹果公司服务部门负责人埃迪·库伊就人工智能(AI)技术发展对消费电子市场的影响发表观点。他当庭指出,AI技术的迭代速度远超预期,结合可穿戴设备的交互能力升级,智能手机可能在十年内面临功能性替代。库伊在陈述中强调,AI与硬件设备的深度融合正在重塑用户需求。他以可穿戴设备为例,认为这类产品未来可通过更自然的交互方式承担通信、信息处理等核心功

特朗普准备撤回“AI芯片出口管制”……各国单独谈判

站长之家(ChinaZ.com) 5月8日 消息:路透社、CNBC等外电当地时间 7 日报道,美国商务部发言人在一份声明中表示,“我们将使人工智能法规变得简单,以促进美国创新、并确保人工智能优势”。该发言人主张,拜登政府时期推行的人工智能出口管制政策“过于复杂和官僚主义”,将阻碍美国的创新。路透社援引多位匿名消息人士的话报道称,特朗普政府不会实施这项定于本月 15 日生效的措施。AI 半导

谷歌突发大招刷爆AI编程榜,网友:不用买Cursor了

声明:本文来自微信公众号“量子位”,作者:白交,授权站长之家转载发布。因为大家太过热情, Gemini2.5提前重磅更新——史上最强编码模型Gemini2.5Pro Preview的I/O版。只需一张手绘的草图,就可以构建一个「绘图变音频」的网页版应用。其他游戏、对象模拟等等也都可以通过一句提示完全搞定。它在所有LMArena排行榜上均超越Claude位列第一,包括所有文本领域、视觉以及Web

Kimi 长思考模型 API 发布

感谢IT之家网友 西窗旧事 的线索投递!IT之家 5 月 6 日消息,kimi-thinking-preview 模型是月之暗面提供的具有多模态推理能力和通用推理能力的多模态思考模型,它擅长深度推理。月之暗面今日宣布,Kimi 长思考模型 API 正式发布。kimi-thinking-preview 模型是目前最新的 k 系列思考模型,用户可以简单地通过更换 model 来使用它,或是通过 o

消息称 AI 编程工具 Cursor 开发商 Anysphere 完成 9 亿美元融资,估值达 90 亿美元

IT之家 5 月 6 日消息,据《金融时报》援引知情人士消息,AI 编程工具开发商 Anysphere 完成了一轮规模达 9 亿美元(IT之家注:现汇率约合 65.19 亿元人民币)的融资,公司估值约为 90 亿美元(现汇率约合 651.87 亿元人民币)。此次融资由 Thrive Capital 领投,安德森・霍洛维茨(Andreessen Horowitz,简称 a16z)和 Accel 等

IBM 首席执行官:AI 已取代数百名人力资源员工

感谢IT之家网友 朱丶工作室 的线索投递!IT之家 5 月 7 日消息,华尔街日报今天(5 月 7 日)发布博文,报道称 IBM 首席执行官 Arvind Krishna 表示,公司已使用 AI 来取代数百名人力资源员工的工作,不过因此也招聘了更多的程序员和销售人员。在接受该媒体采访时,Krishna 透露公司已通过人工智能技术,特别是 AI 智能体,替代了数百名人力资源岗位的职能。这些 AI