Dimension Studio 推出全新端到端 AI 媒体制作流程

为帮助电影制作人和内容创作者以更快的速度和更高的效率交付作品,Dimension Studio 近日宣布推出一套全新的端到端 AI 内容制作管道。该公司还为此制作了一部名为《玛拉与米洛:魔法与混沌》的动画短片,以展示这一新解决方案的强大功能。Dimension Studio 的首席创新官朱奈德・贝格(Junaid Baig)表示,在内容生成中,保持镜头之间的控制与一致性一直是最大的挑战之一。通过这

初创公司 Brellium 获 1670 万美元融资,助力医疗记录审核的智能化升级

初创公司 Brellium 近日宣布获得1670万美元的 A 轮融资,资金将用于扩大其基于人工智能的医疗记录审核解决方案。这一技术旨在帮助医疗机构自动化临床质量管理和保险合规,从而提升医疗服务的效率与准确性。Brellium 的联合创始人扎克・罗森(Zach Rosen)在一次个人经历中深刻感受到医疗文档的疏漏可能对患者造成的严重影响。多年前,他因医疗误诊而经历了长达两年的挫折,频繁奔波于各类专家

途牛上线“AI助手小牛”:开源大模型加持,一站式智能出行服务开启

4月1日下午,途牛旅游网宣布其自主研发的“AI助手小牛”旅游应用Agent正式上线,同步登陆途牛旅游APP和“AI助手小牛”小程序。据介绍,“AI助手小牛”创新性地采用了开源大模型DeepSeek和通义千问,并深度融合旅行垂直应用场景,旨在为用户提供更便捷高效的出行体验。通过“AI助手小牛”,用户可以轻松实现机票、酒店、火车票的快捷查询和预订。更值得一提的是,该AI助手还具备智能推荐出行方案的能力

GPT-4o图像生成能力跻身顶尖行列:多领域表现亮眼,挑战AI创意极限

近日,人工智能领域再次掀起热议,OpenAI旗下的GPT-4o图像生成模型凭借卓越性能,在行业权威评测中脱颖而出。据最新社交媒体讨论透露,GPT-4o在图像生成质量的ELO评分中与新兴模型Reve并列第一,超越了Recraft V3、FLUX1.1[pro]以及Google的Gemini2.0Flash等强劲对手。这一成绩不仅巩固了OpenAI在生成式AI领域的领先地位,也引发了业界对该模型应用潜

谷歌 Gemini Live 功能全面开放,安卓用户迎来新体验

近日,谷歌宣布其 Gemini 应用中的 Gemini Live 功能将免费向所有安卓用户开放。这一功能最早于本月早些时候仅限于 Pixel9和三星 Galaxy S25用户,通过 Gemini Advanced 订阅才能使用。然而,随着用户对 Gemini Live 功能的积极反馈,谷歌决定改变策略,推动这一功能的普及。Gemini Live 功能的强大之处在于它能够实时识别用户手机摄像头和屏幕

AI 领域冲突升级:OpenAI 呼吁禁用中国产模型引发行业震荡

OpenAI 以 “国家控制风险” 为由呼吁全球禁用中国产 AI 模型,引发技术自由派与安全优先派激烈对峙,折射中美科技竞争新阶段。行业面临技术阵营分化、供应链重构、开源社区震荡等冲击,争议焦点围绕国家安全与技术开放的平衡及跨国 AI 治理框架构建。

医疗AI新星每因智能获千万融资,致力于精准疾病风险预测

近日,杭州的医疗 AI 公司每因智能科技有限公司宣布完成千万元级种子轮融资,资金将主要用于其核心产品的研发及商业化落地。此次融资由卓源亚洲等机构领投,西湖政府直投基金也进行了跟投。每因智能专注于运用人工智能技术来预测疾病风险,推动健康管理。其核心产品是基于自研的 DP-LLM 大模型,能够支持多模态医疗数据的处理,精准量化个体未来的疾病风险,涵盖数百种疾病及上万个风险因子。创始人兼 CEO 郭潇宇

AI进化论——音乐、绘画和舞蹈的DeepSeek时刻

声明:本文来自于微信公众号 AI微果酱,作者:黄永轩,授权站长之家转载发布。“昔者仓颉作书,而天雨粟,鬼夜哭”——人类掌握文字后,天地为之动容,因为属于人类的文明诞生了。“仓颉作书”出自西汉《淮南子》,距离人类掌握文字已经过去了千年。也许,下一个千年,后人记载2025年大语言模型的涌现时,也会做出类似的描述。当机器掌握文字后,人类文明必然发生嬗变,只是身在局中的我们,感知不到这种天地动容的震撼

TrendForce:预计中国市场 2025 年人形机器人本体产值将超 45 亿

IT之家 4 月 21 日消息,TrendForce 集邦咨询今日发文,中国市场已有 11 家主流人形机器人本体厂商在 2024 年开启量产计划,其中有 6 家如宇树科技、优必选、智元机器人、银河通用、众擎机器人、乐聚机器人等厂商对 2025 年量产规划超过千台。IT之家从报告获悉,预计中国市场 2025 年人形机器人本体产值将超过 45 亿元人民币,加上马斯克关于 Tesla Optimus

瑞士研究人员称AI能够识别出可能存在生命行星的隐藏位置

浩瀚宇宙,繁星亿万,寻找另一颗蓝色星球的梦想,如同大海捞针。但现在,来自瑞士的一支科研团队,为这场史诗级的探索注入了强大的新动能。他们精心打造了一款人工智能模型,如同一位目光锐利的星际侦探,能够穿透星尘,洞察那些可能隐藏着宜居世界的未知角落。这不仅仅是一项技术突破,更像是一张指向未来的藏宝图。在一篇发表于《天文学与天体物理学》杂志的最新研究中,科学家们详细描绘了这位 AI 侦探的非凡能力。通过深度

智谱发布Agent产品AutoGLM沉思:首个实现"边想边干"的智能体

今日,智谱AI在2025中关村论坛上发布了其最新Agent产品——AutoGLM沉思。这是业内首个集深度研究能力和操作能力于一体的Agent产品,其最大特点是能够"边想边干"。AutoGLM沉思突破了传统AI模型的局限,能够同时进行复杂思考与执行操作。它可以像人类一样打开并浏览网页,完成从数据检索、分析到生成报告的全流程任务,实现了思考与行动的紧密结合。智谱表示,AutoGLM沉思背后的技术支撑是

得州大学奥斯汀分校开发新型 AI 智能体 Metamon:能像人一样玩宝可梦

IT之家 4 月 10 日消息,据外媒 ASCII 今日报道,美国得克萨斯大学奥斯汀分校的 Yuke Zhu 助理教授及其团队于 4 月 10 日发布了一款能够像人类一样进行宝可梦对战的 AI 智能体“Metamon”。IT之家附项目地址:点此前往我们暂时从机器人技术中抽身,构建了一个能够像人类一样进行竞技宝可梦对战的 AI 智能体。部分可观测。随机性。长期规划。现在通过离线强化学习 + Tra

DeepSeek引爆 AI原生App活跃用户数一个月几乎翻倍

快科技4月16日消息,QuestMobile数据表明,截至2025年2月,AI原生App的活跃用户数量达到了2.4亿。这主要得益于年初AI领域迎来标志性事件,DeepSeek-R1模型迅速引爆全球。短短一个月内,国内原生App行业规模几近翻倍。DeepSeek-R1模型不仅为整个行业带来了成倍的增长,还打破了去年长期稳定的市场格局。根据QuestMobile的数据,2025年3月,DeepSe

华晨宝马与字节跳动火山引擎合作,推动AI赋能汽车营销

近日,华晨宝马领悦数字信息技术有限公司(“领悦”)与字节跳动旗下火山引擎达成合作,双方将在人工智能(AI)技术的帮助下创新汽车营销服务。此次合作通过AI技术实现精准的产品匹配与购车建议,优化内容引导,提升用户购车体验及经销商运营效率。宝马集团大中华区总裁高翔表示,AI是宝马打造更智能、贴心出行解决方案的关键,正在加速融入研发、生产、供应链、产品、服务及运营各个环节。“此次合作将推动营销模式的创新,

Suna – 全球首款开源的通用 AI Agent

Suna是什么Suna 是全球首款开源的通用 AI Agent,支持高效解决现实场景中的各类任务。基于自然流畅的对话交互,Suna 支持智能辅助研究分析、数据处理及日常事务,化身专属数字伙伴。Suna 具备强大的功能,包括浏览器自动化、文件管理、网络爬虫、命令行执行、网站部署及与多种API的集成。Suna 结合直观的界面和强大的工具集,解决复杂问题并自动化工作流程。支持用户自托管Suna,用简

Excel MCP Server上线 可通过Claude等客户端直接操作Excel文件

一款名为Excel MCP Server的开源工具近日引发热议。这款基于**模型上下文协议(Model Context Protocol, MCP)**开发的服务器,允许用户通过AI助手直接操作Excel文件,无需安装微软Excel软件即可实现高效的表格处理。GitHub项目地址为:https://top.aibase.com/tool/excel-mcp-server据悉,该工具通过AI客户端如

首次实现图像思考 OpenAI重磅发布o3/o4-mini:史上最强、最智能模型

快科技4月17日消息,今日,OpenAI新款AI模型o3、o4-mini重磅发布,这是OpenAI迄今最强、最智能的模型。据了解,OpenAI o3/o4-mini首次具备真正的视觉推理能力,看图识图已经是小菜一碟了,现在还会看图思考。OpenAI o3/o4-mini能同时处理文本、图像和音频,并且能作为Agent智能体自动调用网络搜索、图像生成、代码解析等工具以及深度思考模式。通过强化学习

谷歌突发大招刷爆AI编程榜,网友:不用买Cursor了

声明:本文来自微信公众号“量子位”,作者:白交,授权站长之家转载发布。因为大家太过热情, Gemini2.5提前重磅更新——史上最强编码模型Gemini2.5Pro Preview的I/O版。只需一张手绘的草图,就可以构建一个「绘图变音频」的网页版应用。其他游戏、对象模拟等等也都可以通过一句提示完全搞定。它在所有LMArena排行榜上均超越Claude位列第一,包括所有文本领域、视觉以及Web

加州大学研究:AI 模型 GPT - 4.5 和 Llama 3.1 - 405B 可通过标准图灵测试

IT之家 4 月 2 日消息,美国加州大学圣地亚哥分校发布了一项研究成果,宣称首次提供了“人工智能系统能够通过标准三方图灵测试的实证证据”。图灵测试由英国数学家和计算机科学家阿兰・图灵于 1950 年提出,他称之为“模仿游戏”。图灵设想,如果一名提问者在通过文本交流时无法区分对方是机器还是人类,那么这个机器可能具备类似人类的智能。在三方图灵测试中,提问者需与一名人类和一台机器进行对话,并准确辨识

Llama 4大模型跌落神坛:作弊刷榜、代码能力极差、和DeepSeek比就是伪开源

4月8日消息,被寄予厚望的美国Meta公司的最新开源大模型Llama 4发布不到2天时间,口碑急转直下,被质疑为刷榜作弊实际效果差、开源条件多部署门槛高是伪开源等。今天,大模型评测平台LM Arena亲自下场发文,打脸Meta提供给平台的Llama 4是“特供版”。据知情人士爆料称,Meta因面临DeepSeek、Gemini等竞品的快速迭代压力,选择“仓促发布未完成优化的模型”,牺牲技术严谨