得州大学奥斯汀分校开发新型 AI 智能体 Metamon:能像人一样玩宝可梦

IT之家 4 月 10 日消息,据外媒 ASCII 今日报道,美国得克萨斯大学奥斯汀分校的 Yuke Zhu 助理教授及其团队于 4 月 10 日发布了一款能够像人类一样进行宝可梦对战的 AI 智能体“Metamon”。IT之家附项目地址:点此前往我们暂时从机器人技术中抽身,构建了一个能够像人类一样进行竞技宝可梦对战的 AI 智能体。部分可观测。随机性。长期规划。现在通过离线强化学习 + Tra

互联网平台现状:鼓励AI,限制AI

声明:本文来自于微信公众号新莓daybreak,作者:何聆筝,授权站长之家转载发布。一场针对AIGC作品的限制,正规模化地席卷各个平台。一些AIGC创作者在小红书拉起群组,分享自己被限制的经历。有人发布12星座内容被判定「传播封建迷信」,有人因为生成AI明星而遇到「侵权」提示。「虚构事件」和「假冒真人」是最常被引用的处罚理由。同样的情况也发生在视频号和抖音,大量AIGC作品遭遇下架和封禁。作品

可灵AI发布全新2.0模型:上线多模态视频编辑功能

快科技4月16日消息,据报道,可灵AI在北京举行灵感成真”2.0模型发布会,正式发布可灵2.0视频生成模型及可图2.0图像生成模型。据介绍,可灵2.0模型在动态质量、语义响应、画面美学等维度保持领先;可图2.0模型在指令遵循、电影质感及艺术风格表现等方面显著提升。3月27日,全球AI基准测试机构Artificial Analysis发布了最新的全球视频生成大模型榜单,快手可灵1.6pro(高品

OpenAI高管计划收购谷歌Chrome:对ChatGPT搜索至关重要

快科技4月23日消息,据报道,OpenAI高管Nick Turley在华盛顿举行的谷歌反垄断庭审中爆出重磅消息:若法院裁定谷歌必须出售Chrome浏览器以恢复搜索市场竞争,OpenAI将有意收购谷歌Chrome浏览器。这场备受瞩目的庭审始于2024年法官裁定谷歌在在线搜索及相关广告市场具有垄断地位。虽然谷歌计划上诉,但庭审已揭开生成式AI领域激烈竞争的冰山一角。检方担忧谷歌的搜索垄断可能延伸至

初创公司 Brellium 获 1670 万美元融资,助力医疗记录审核的智能化升级

初创公司 Brellium 近日宣布获得1670万美元的 A 轮融资,资金将用于扩大其基于人工智能的医疗记录审核解决方案。这一技术旨在帮助医疗机构自动化临床质量管理和保险合规,从而提升医疗服务的效率与准确性。Brellium 的联合创始人扎克・罗森(Zach Rosen)在一次个人经历中深刻感受到医疗文档的疏漏可能对患者造成的严重影响。多年前,他因医疗误诊而经历了长达两年的挫折,频繁奔波于各类专家

全球首个自回归视频生成大模型 MAGI-1 重磅发布,Swin Transformer 团队引领视频创作新潮流

在视频生成领域,最近涌现出了一位强劲的新选手 ——MAGI-1。这款由马尔奖和清华特奖得主曹越领导的创业公司 Sand AI 推出的自回归视频生成大模型,正在重新定义视频创作的可能性。MAGI-1通过预测视频块的序列来生成视频,以其自然流畅的效果和多个可下载版本引发广泛关注。MAGI-1在生成视频时具有诸多优越性能。首先,它提供了无缝流畅的视频体验,能够生成连续的长视频场景,没有尴尬的剪辑或突兀的

Firecrawl推出FIRE-1:具备网页智能交互能力的AI数据抓取工具

Firecrawl宣布推出其最新AI数据抓取工具FIRE-1,这标志着网页数据抓取技术迈向智能化新阶段。FIRE-1不仅延续了Firecrawl在高效数据提取领域的优势,还通过集成先进的AI交互能力,实现了对复杂网站结构的智能导航与动态内容处理。FIRE-1:超越传统网页抓取传统网页抓取工具通常依赖静态HTML解析或手动配置,面对JavaScript驱动的动态网页或需要交互(如点击按钮、填写表单)

OpenAI 新模型 GPT-4.1 可靠性遭质疑:独立测试显示其对齐性下降

IT之家 4 月 24 日消息,本月早些时候 OpenAI 推出了 GPT-4.1 人工智能模型,并声称该模型在遵循指令方面表现出色。然而,多项独立测试的结果却显示,与 OpenAI 以往发布的模型相比,GPT-4.1 的对齐性(即可靠性)似乎有所下降。据IT之家了解,通常情况下,OpenAI 在推出新模型时,会发布一份详细的技术报告,其中包含第一方和第三方的安全评估结果。但此次对于 GPT-4

LemonAI 推出实时音视频 AI 数字人模型 Slice Live

近日,LemonAI 正式发布其最新产品——Slice Live,这是一款全球首创的实时音视频 AI 模型,凭借突破性技术,用户仅需上传一张照片,即可与任意虚拟角色进行实时视频通话。据 LemonAI 官方介绍,Slice Live 采用先进的 Transformer 模型,每秒25帧的速率实时渲染屏幕上的每一个像素。这种高效的生成能力确保了画面流畅性和真实感,无论是虚拟角色的面部表情、动作,还是

英伟达推多模态LLM Describe Anything:指定特定区域生成详细的描述

NVIDIA AI团队发布了一款革命性的多模态大语言模型——Describe Anything3B(DAM-3B),专为图像和视频的精细化、区域化描述而设计。这款模型凭借创新技术和卓越性能,在多模态学习领域掀起热议,成为AI技术发展的又一里程碑。以下,AIbase为您梳理这款模型的核心亮点与行业影响。区域化描述的突破DAM-3B以其独特的能力脱颖而出:能够根据用户指定的图像或视频区域(如点、框、涂

跟上 ChatGPT 及 Gemini 步伐,马斯克 xAI 旗下 Grok 增加“记忆”功能

感谢IT之家网友 往事2016 的线索投递!IT之家 4 月 17 日消息,马斯克创办的人工智能公司 xAI 正在让旗下聊天机器人 Grok 逐步追赶 ChatGPT 和谷歌 Gemini,努力缩小差距。xAI 今日宣布 Grok 新增“记忆”功能,能根据用户过去的对话内容记住相关细节。这样一来,当用户请求推荐时,Grok 将依据此前的互动经验,提供更贴合个人偏好的答案 —— 前提是用户的使用

UniToken:多模态AI的“全能选手”,一次编码搞定图文理解与图像生成

声明:文来自微信公众号“量子位”,作者:UniToken团队,,授权站长之家转载发布。首次在统一框架内实现理解与生成的“双优表现”,打破了多模态统一建模的僵局!复旦大学和美团的研究者们提出了UniToken——一种创新的统一视觉编码方案,在一个框架内兼顾了图文理解与图像生成任务,并在多个权威评测中取得了领先的性能表现。UniToken通过融合连续和离散视觉表征,有效缓解了以往方法中“任务干扰”

华硕灵耀全球巡展登陆米兰:美学与AI的完美融合

在2025年这场备受瞩目的米兰设计周上,Design You Can Feel 耀启新境”华硕灵耀艺术家全球巡展再次闪耀登场,引领着一场关于科技与美学深度融合的全新探索之旅。回首过往,继在上海和伦敦站取得巨大成功之后,此次展览将目光聚焦于材质、工艺及AI这三大极具前瞻性的领域,深入探讨科技与美学之间的张力。一直以来,华硕灵耀系列在高端轻薄本的道路上砥砺前行,通过轻薄材质创新、AI与双屏交互、O

最新AI新闻快讯去哪看?每日AI日报资讯获取平台推荐

在人工智能(AI)领域,获取全面且高质量的资源对于开发者、研究人员和爱好者来说至关重要。AIbase(https://www.aibase.com/zh)正是这样一个综合性平台,它致力于为用户提供丰富的AI资源,帮助他们更好地探索和应用AI技术。AIbase是一个专注于人工智能和机器学习领域的综合性资源平台,旨在为用户提供一站式的AI学习、开发和应用体验。该平台汇集了最新的AI资讯、工具、教程

智谱发布Agent产品AutoGLM沉思:首个实现"边想边干"的智能体

今日,智谱AI在2025中关村论坛上发布了其最新Agent产品——AutoGLM沉思。这是业内首个集深度研究能力和操作能力于一体的Agent产品,其最大特点是能够"边想边干"。AutoGLM沉思突破了传统AI模型的局限,能够同时进行复杂思考与执行操作。它可以像人类一样打开并浏览网页,完成从数据检索、分析到生成报告的全流程任务,实现了思考与行动的紧密结合。智谱表示,AutoGLM沉思背后的技术支撑是

马斯克:将出现新方案实现自动驾驶 仅需摄像头和AI芯片

站长之家(ChinaZ.com) 4月15日 消息:当地时间4月14日,特斯拉首席执行官埃隆·马斯克在社交媒体透露,公司即将推出基于纯AI技术的全自动驾驶(FSD)解决方案。该方案完全依赖摄像头与特斯拉自主研发的AI芯片,并由其AI软件驱动,与特斯拉长期坚持的“纯视觉自动驾驶”技术路线一致。特斯拉近期通过官方X账号发布视频,展示其德克萨斯工厂内FSD无监督技术的应用场景。视频中,新款Model

DeepSeek引爆 AI原生App活跃用户数一个月几乎翻倍

快科技4月16日消息,QuestMobile数据表明,截至2025年2月,AI原生App的活跃用户数量达到了2.4亿。这主要得益于年初AI领域迎来标志性事件,DeepSeek-R1模型迅速引爆全球。短短一个月内,国内原生App行业规模几近翻倍。DeepSeek-R1模型不仅为整个行业带来了成倍的增长,还打破了去年长期稳定的市场格局。根据QuestMobile的数据,2025年3月,DeepSe

挑战GPT-4o!AI文生图惊现黑马,国产团队HiDream如何逆袭?

声明:本文来自于微信公众号 AI新榜,作者:王萌,授权站长之家转载发布。AI的“神仙打架”从未停歇,尤其在文生图这个烧钱又内卷的赛道。但当所有人的目光都聚集在OpenAI、Google、Midjourney等“头号玩家”时,一个相对低调的中国团队,却悄然登上了多个AI模型能力榜单前列,引起AI圈热议,它就是HiDream。4月21日排名海外论坛Reddit网友对HiDream的评价而且HiDr

华晨宝马与字节跳动火山引擎合作,推动AI赋能汽车营销

近日,华晨宝马领悦数字信息技术有限公司(“领悦”)与字节跳动旗下火山引擎达成合作,双方将在人工智能(AI)技术的帮助下创新汽车营销服务。此次合作通过AI技术实现精准的产品匹配与购车建议,优化内容引导,提升用户购车体验及经销商运营效率。宝马集团大中华区总裁高翔表示,AI是宝马打造更智能、贴心出行解决方案的关键,正在加速融入研发、生产、供应链、产品、服务及运营各个环节。“此次合作将推动营销模式的创新,

途牛上线“AI助手小牛”:开源大模型加持,一站式智能出行服务开启

4月1日下午,途牛旅游网宣布其自主研发的“AI助手小牛”旅游应用Agent正式上线,同步登陆途牛旅游APP和“AI助手小牛”小程序。据介绍,“AI助手小牛”创新性地采用了开源大模型DeepSeek和通义千问,并深度融合旅行垂直应用场景,旨在为用户提供更便捷高效的出行体验。通过“AI助手小牛”,用户可以轻松实现机票、酒店、火车票的快捷查询和预订。更值得一提的是,该AI助手还具备智能推荐出行方案的能力