深圳大学人工智能学院正式揭牌成立,打造本硕博一体化 AI 人才培养体系

IT之家 4 月 21 日消息,据深圳卫视深视新闻报道,深圳大学人工智能学院今日正式揭牌成立。学院建设基础学科研究中心和算力平台,与腾讯云共建产业学院。目前该学院包含 2 位中国科学院院士、1 位日本工程院院士、5 位国家级人才、2 位国家青年人才的约 80 人教研团队。学院以创新的学科布局,构建起全面的本硕博一体化专业体系,学科方向覆盖人工智能基础理论、具身智能等前沿。学院秉持“厚基础、重交叉

昆仑万维开源 SkyReels-V2 模型,开启生成“无限时长”视频时代

IT之家 4 月 21 日消息,昆仑万维今日正式发布并开源 SkyReels-V2—— 全球首个使用扩散强迫(Diffusion-forcing)框架的无限时长电影生成模型,其通过结合多模态大语言模型(MLLM)、多阶段预训练(Multi-stage Pretraining)、强化学习(Reinforcement Learning)和扩散强迫(Diffusion-forcing)框架来实现协同优

OpenUtau – 开源的AI歌声合成工具,自动适配系统语言

OpenUtau是什么OpenUtau 是开源的歌声合成工具,兼容 UTAU 音源库和重采样器,支持 VSQX 导入、多语言界面及预渲染功能,帮助创作者快速预览作品节省时间。OpenUtau现代化的界面和丰富的编辑功能,如音素器、颤音编辑器等,让音乐创作更加直观高效。OpenUtau 支持 Windows、macOS 和 Linux 系统,开箱即用,适合音乐创作者和歌声合成爱好者。Open

刚刚,OpenAI发布GPT-image-1模型,更强吉卜力版本来啦

声明:本文来自于微信公众号AIGC开放社区,授权站长之家转载发布。今天凌晨1点30,OpenAI发布了全新图像模型GPT-image-1,已经通过API向全球开发者开放使用。GPT-image-1与ChatGPT版本有很大不同,可以控制生成图像的敏感度、生成效率、背景、输出格式、渲染质量、压缩质量等,并且支持全网爆火的吉卜力模式。目前,Adobe、Figma、HeyGen、Wix等知名企业已经

东风汽车发布 “天元智能” 技术品牌,助力智能化未来

在2025上海车展上,东风汽车以 “智绘新东风” 为主题隆重亮相,展出了26台整车和9项前沿技术展品。这次展会标志着东风汽车旗下自主品牌的首次联合展出,展示了其在智能汽车领域的雄心和创新能力。东风汽车在此次展会上正式推出了 “天元智能” 技术品牌,构建了一个名为 “一核双基双元” 的智能化技术体系。其中,“一核” 指的是企业级的太极大模型;“双基” 则包括天元架构和天元 OS;而 “双元” 则是指

腾讯混元3D生成模型正式发布2.5版本 建模精细度大幅提升

4月23日,腾讯混元3D生成模型正式发布2.5版本,标志着3D生成技术迈入超高清时代。此次升级不仅在建模精细度上实现了质的飞跃,还为用户带来了更高效、更便捷的创作体验,同时进一步降低了3D内容创作的门槛。在技术层面,混元3D v2.5版本的建模精细度大幅提升,有效几何分辨率达到1024,从标清升级到了高清画质。模型架构也实现了全面升级,总参数量从1B提升至10B,有效面片数增加超10倍。这一改进使

富士通联手Nutanix推出日语大模型Takane,瞄准企业私有AI市场

富士通与Nutanix达成战略合作,将其专为日语优化的Takane大语言模型(LLM)引入Nutanix企业AI平台(NAI)。这一合作标志着首个日语增强型LLM获得Nutanix AI平台认证,为企业私有AI部署提供了新选择。技术优势:专为日语优化Takane模型针对日语特有的语言挑战进行了优化,包括混合字符集(平假名、片假名和汉字)、省略主语以及日语商务交流中常见的微妙敬语表达。富士通声称,与

白板+代码编辑器组合工具pad.ws:开发者可在同一界面画图编程,实现边画边写代码

近日,一款名为pad.ws的在线工具引发了广泛关注。这款工具将白板与代码编辑器无缝结合,为开发者、设计师和团队协作提供了全新的解决方案。pad.ws 是一个运行于浏览器的开源工具,集成了电子白板与代码编辑环境,旨在为用户提供一站式的创意与开发体验。不同于传统的单一功能工具,pad.ws通过直观的界面和强大的功能,将头脑风暴、流程图绘制与实时代码编写融为一体。无论是远程团队协作、教学演示,还是快速原

海螺推出图像人物参考功能 允许用户基于单张图像生成多角度、动态姿势的角色图像

MiniMax旗下的Hailuo AI正式推出Hailuo Image全新功能——Character Reference,为AI图像生成领域带来突破性创新。据AIbase了解,该功能允许用户基于单张参考图像生成具有多角度、动态姿势、丰富表情的角色图像,支持电影化光影与构图,并提供全面的提示词控制。社区对这一功能的发布反响热烈,项目详情已通过Hailuo官网与GitHub公开,标志着Hailuo在角

腾讯混元 3D 生成模型升级 2.5 版本:建模精细度提升,免费生成额度翻倍

感谢IT之家网友 Autumn_Dream 的线索投递!IT之家 4 月 23 日消息,腾讯今日宣布,混元 3D 生成模型全新升级,v2.5 新版本在建模精细度上大幅提升。混元 3D AI 创作引擎全面更新至 v2.5 模型底座,同时免费生成额度翻倍,提升至每天 20 次。混元 3D 生成 API 也已上线腾讯云,面向企业和开发者开放。相比前代,混元 3D v2.5 模型架构全面升级,总参数量

AI日报:腾讯混元3D生成模型2.5版本发布;海螺推出图像人物参考功能;百度上线移动端超级智能体心响App

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、Manus开源平替!Kortix-AI正式发布开源通用AI智能体平台SunaKortix-AI推出了Suna,一个开源的通用AI智能体平台,旨在成为Manus的替代品。Sun

最新AI产品从哪获取?海外、国内AI产品排行榜去哪看?

嘿,小伙伴们!今天给大家带来一个超有料的AI宝藏网站——AIbase基地(https://www.aibase.com/zh)!如果你对人工智能感兴趣,或者正在寻找AI行业的最新资讯、工具和变现机会,那这个网站绝对值得你收藏!🚀🎯 网站简介AIbase基地是一个专注于人工智能领域的综合性平台,旨在为用户提供全面的AI资讯、工具、产品和变现指南。它的目标是让更多人看到未来,通往AGI(通用人工智

SurveyGO – 清华联合面壁智能开源的AI论文写作工具

SurveyGO是什么SurveyGO(卷姬) 是清华联合面壁智能团队开源的AI论文写作工具。支持根据用户输入的论文主题和描述,快速生成结构清晰、内容丰富的综述文章,帮助科研人员和学生高效完成文献综述部分。SurveyGO核心技术 LLMxMapReduce-V2 借鉴卷积神经网络原理,基于文本卷积算法聚合多篇参考文献,避免传统方法中信息丢失的问题。生成的文章逻辑严谨、引用可靠,长度和细节丰富

ImagePulse – 魔搭社区开源的图像理解和生成模型数据集

ImagePulse是什么ImagePulse (图律脉动)是魔搭社区推出的开源项目,为下一代图像理解和生成模型提供数据集支持,通过原子化模型的能力并构建原子能力数据集。项目包含多个原子能力数据集,例如“修改、添加、移除”“放大、缩小”“风格迁移”和“人脸保持”等,每个数据集都针对特定的图像编辑或生成任务。ImagePulse的主要功能原子能力数据集构建:ImagePulse 提供了多

颠覆性开源 TTS 模型 Dia 发布:情绪、非语言提示全支持,媲美真人对话

一家名为 Nari Labs 的两人创业公司发布了 Dia,这是一个拥有16亿参数的文本转语音 (TTS) 模型,旨在直接从文本提示生成自然对话。其联合创始人 Toby Kim 声称,Dia 的性能超越了 ElevenLabs 等竞争对手的专有产品以及谷歌的 NotebookLM AI 播客生成功能,并可能对 OpenAI 近期发布的 gpt-4o-mini-tts 构成威胁。Kim 在社交媒体

谷歌 Gemini 推出视频分析功能,能准确识别视频拍摄场所

近日,科技媒体 Android Authority 报道称,谷歌最新的 Gemini 聊天机器人引入了一项引人注目的新功能 —— 视频分析。用户现在可以轻松上传视频并提问,Gemini 会基于视频内容进行智能分析,回答相关问题。这一创新功能无疑为视频内容的处理带来了新的可能性,吸引了广大用户的关注。在测试中,Gemini 展现出了惊人的能力。通过分析视频中的建筑风格和地理线索,AI 能够准确判断出

RAG增强系统Node:AI检索革命,效率飙升30%!

随着生成式人工智能技术的飞速发展,检索增强生成(Retrieval-Augmented Generation, RAG)系统正成为提升大语言模型(LLM)准确性和上下文相关性的关键技术。近日,一款名为NodeRAG的创新RAG增强系统引起了业界广泛关注,其独特的异构图结构为RAG工作流带来了革命性突破。NodeRAG:异构图驱动的RAG新范式NodeRAG是一个以图结构为核心的RAG框架,通过引入

超强AI电商购物助手!Add To Cart AI:可理解文本、语音、图像,帮用户找到产品

在当今快速发展的电商行业中,AI电商购物助手发展也备受关注。Add To Cart AI 是一款专为电商平台设计的 AI 驱动购物助手,旨在帮助消费者更快找到心仪产品,同时提升商家的转化率和销售额。它可以理解文本、语音、图像甚至实时视频的代理。Add To Cart AI 的最大亮点在于它能够瞬间将购物清单、聊天记录和图片转化为完整的购物车。这意味着消费者在寻找心仪商品时,无需繁琐的操作,只需提供

Leidos投资 1000 万美元推进 AI 辅助疾病检测工具开发

Leidos近日宣布,将在未来五年内投资1000万美元,与匹兹堡大学计算病理学与人工智能卓越中心(CPACE)合作,致力于开发基于人工智能的疾病检测和管理工具。此次合作的首要任务是利用 AI 技术加速心脏病和癌症的检测,提高诊断的周转时间,进而促进更有效的医疗管理。图源备注:图片由AI生成,图片授权服务商MidjourneyLeidos首席执行官汤姆・贝尔表示,这项投资的目标是加速对每年影响数百万

Dimension Studio 推出全新端到端 AI 媒体制作流程

为帮助电影制作人和内容创作者以更快的速度和更高的效率交付作品,Dimension Studio 近日宣布推出一套全新的端到端 AI 内容制作管道。该公司还为此制作了一部名为《玛拉与米洛:魔法与混沌》的动画短片,以展示这一新解决方案的强大功能。Dimension Studio 的首席创新官朱奈德・贝格(Junaid Baig)表示,在内容生成中,保持镜头之间的控制与一致性一直是最大的挑战之一。通过这