Luma Ray2 Camera Concepts API 发布:AI 视频生成迈向电影级控制

Luma AI 宣布其旗舰视频生成模型 Ray2的 Camera Concepts API 正式上线,为开发者提供了前所未有的电影级镜头控制能力。结合此前推出的 Camera Motion Concepts 和 Camera Angle Concepts,这一 API 的发布标志着 AI 视频生成技术在创意控制和生产效率上的重大突破。Camera Concepts API:赋予开发者电影级创意控制

OpenAI没说的秘密,Meta全揭了?华人一作GPT-4o同款技术,爆打扩散王者

声明:本文来自微信公众号“新智元”,作者:新智元,编辑:KingHZ,授权站长之家转载发布。自回归模型的新突破:首次生成2048×2048分辨率图像!来自Meta、西北大学、新加坡国立大学等机构的研究人员,提出了TokenShuffle,为多模态大语言模型(MLLMs)设计的即插即用操作,显著减少了计算中的视觉token数量,提高效率并促进高分辨率图像合成。图1:采用新技术的27亿参数自回归模

DeepSeek-Prover-V2 登场:AI 数学推理新王者,88.9% 通过率设新标杆

IT之家 5 月 1 日消息,深度求索(DeepSeek)昨日(4 月 30 日)在 AI 开源社区 Hugging Face 上,发布名为 DeepSeek-Prover-V2-671B 的新模型,随后在 GitHub 等平台上公布了论文信息。IT之家援引论文介绍,DeepSeek-Prover-V2 是一款专注于形式化数学推理的开源大型语言模型,基于 DeepSeek-V3-0324,通过递

Trae v1.3.0版本正式发布:AI驱动编程体验全面升级

ByteDance旗下AI驱动的集成开发环境(IDE)Trae正式发布v1.3.0版本。此次更新带来了统一对话体验、增强的上下文能力、自定义规则支持以及全面升级的Agent功能,同时新增对Model Context Protocol(MCP)的支持,为开发者提供了更智能、更灵活的编程体验。以下基于最新公开信息整理的报道,详细介绍Trae v1.3.0的亮点与变革。统一对话体验:Chat与Build

Vector Institute 发布 AI 模型性能评估报告,助力透明性与可信度

人工智能(AI)模型的发展速度让人眼花缭乱,技术开发者们在不断提升其性能的同时,也引发了用户对于模型表现真实度的疑虑。为了解决这一问题,由杰弗里・辛顿(Geoffrey Hinton)创办的 Vector Institute 为人工智能研究推出了《评估现状研究》。该研究通过互动排行榜对11个顶尖的开放源代码和闭源模型进行了全面评测,涵盖了数学、通用知识、编码、安全性等16个基准。Vector In

程序员挑战极限:在古老的 DOS 系统上成功运行 Llama 2 模型

在科技飞速发展的今天,一位勇敢的程序员选择回归经典,尝试在老旧的 DOS 环境中运行 Meta 公司最新发布的大语言模型 Llama2。Yeo Kheng Meng,这位因开发 ChatGPT DOS 客户端而声名鹊起的程序员,花费了一个周末的时间,成功地将这个大型语言模型移植到传统计算环境中,展现了无与伦比的技术创造力。项目的起步得益于开源代码的便利。Meng 使用了名为 “llama2.c”

芝浦工大创新Vote-based框架,大幅提升手持物体姿态估计精度

在增强现实(AR)等应用中,手持物体的姿态估计是一项至关重要但颇具挑战性的任务。近期,日本芝浦工业大学的研究团队提出了一种基于 Vote 机制的多模态融合框架,显著提高了这一领域的准确性,令人瞩目地提升了13.9% 的姿态估计精度。这一新方法的核心在于有效整合来自 RGB(颜色)和深度图像的数据,特别是在手遮挡物体的情况下。研究团队指出,现有的姿态估计技术往往在手部遮挡时遇到精度下降的难题,而手与

大厂混战AI笔记:快手“喵记多”能否复制Notion增长神话?

快手近日推出了一款名为“喵记多”的全新App,正式进军AI辅助的笔记工具市场。该产品由快手旗下的轻雀科技开发,核心亮点在于集成了一个名为“喵仔”的智能助手,用户可以通过聊天交互的方式完成笔记管理和待办提醒。据悉,“喵记多”的主要功能包括笔记剪藏、内容整理和记忆搜索。用户可以将零散的文字、图片、文件等发送给喵仔,并通过长按消息选择“喵记一下”将其转化为笔记,方便后续编辑和管理。直接向喵仔发送“记笔记

字节发布豆包1.5深度思考模型:多模态深度思考、延迟低

在4月17日的火山引擎 AI 创新巡展杭州站上,字节跳动旗下的火山引擎总裁谭待正式发布了最新的豆包1.5・深度思考模型。此次发布会吸引了众多行业人士的关注,谭待在会上分享了该模型在多个领域的优异表现。据悉,豆包1.5模型在数学、编程、科学推理等专业领域,以及创意写作等任务中,都展现出了卓越的能力。这款新模型采用了 MoE(混合专家)架构,总参数达200亿,而激活参数仅为20亿,显著低于行业同类模型

宝马中国将接入DeepSeek!爆新世代车型搭载AI智能体

快科技4月27日消息,继宝马与阿里巴巴达成AI大语言模型战略合作后,宝马中国宣布接入DeepSeek,深化中国本土AI生态布局。宝马中国表示:未来,DeepSeek功能也将应用于国产宝马新世代车型。从今年三季度开始,宝马中国将率先应用于多款搭载第9代宝马操作系统的中国在售新车,通过深度思考能力赋能以宝马智能个人助理为中心的人机交互体验。宝马集团董事长齐普策表示,宝马正强化与中国科技领军企业的合