字节 Seed 开源 UI-TARS-1.5:基于视觉-语言模型构建的多模态智能体
IT之家 4 月 18 日消息,IT之家从豆包大模型团队获悉,UI-TARS-1.5 昨日正式发布并开源。这是一款基于视觉-语言模型构建的开源多模态智能体,能够在虚拟世界中高效执行各类任务。有关的链接如下:GitHub:https://github.com/bytedance/UI-TARSWebsite:https://seed-tars.com/Arxiv:https://arxiv.org