字节跳动开源Liquid多模态模型,革新视觉与语言统一生成

人工智能领域迎来一项重大突破。AIbase从社交媒体获悉,字节跳动于近日宣布开源其全新多模态生成模型Liquid,该模型以创新的统一编码方式和单一大语言模型(LLM)架构,实现了视觉理解与生成任务的无缝整合。这一发布不仅展示了字节在多模态AI上的技术雄心,也为全球开发者提供了强大的开源工具。以下是AIbase对Liquid模型的深度解析,探索其技术创新、核心发现及行业影响。Liquid模型亮相:统

获赞百万、轻松变现?AI短视频是“风口”还是“骗局”

声明:本文来自于微信公众号 新播场 作者:新播场,授权站长之家转载发布。用AI做短视频获赞百万、涨粉几十万,门槛低还轻松变现?AI热潮之下,短视频平台上出现了许多用AI制作的账号:用Deepseek写文案,用即梦做图、生成视频,再用剪辑软件进行编辑。尤其是今年以来、利用AI生成古人形象、配上养生内容的“AI养生”十分火热。然而,这类账号真的那么容易上手吗?普通人到底能不能赚到钱?或许,比起“挖

售价将超万元!Meta计划推出高端AI眼镜:首次配售腕带控制器

快科技4月3日消息,近日,据媒体报道,Meta计划最快在今年年底推出智能眼镜系列中一款更高端的版本,内部代号为Hypernova”。该产品将内置更清晰的单眼显示屏并升级摄像头等配套设备,预计其售价将超过1000美元(约合人民币7270元),甚至有可能达到1400美元(约合人民币1.02万元)。有内部人士表示,屏幕升级是这款眼镜价格出现显著上涨的主要原因。该款眼镜将显示一个位于右镜片右下角区域的

小巧却强大!IBM发布新语言模型Granite 4.0 Tiny Preview:长上下文处理

IBM 发布了 Granite4.0Tiny Preview,这是即将推出的 Granite4.0系列语言模型中最小的一款的预览版本。该模型不仅具备高效的计算能力,还为开源社区提供了一个值得关注的实验平台。高效的性能与极小的内存需求 Granite4.0Tiny 在 FP8精度下,能够在消费级硬件上运行多个长上下文(128K)的并发任务,适用于市面上价格低于350美元的 GPU。尽管该模型目前仅经

NoteLLM – 小红书推出的笔记推荐多模态大模型框架

NoteLLM是什么NoteLLM 是小红书推出的针对笔记推荐的多模态大型语言模型框架。NoteLLM 基于生成笔记的压缩嵌入和自动生成标签类别,用大型语言模型(LLM)的强大语义理解能力,结合对比学习和指令微调技术,提升笔记推荐的准确性和相关性。NoteLLM-2 在NoteLLM基础上引入多模态输入,基于端到端微调策略,结合视觉编码器和 LLM,解决视觉信息被忽视的问题。NoteLLM-2

选 AI 比选对象还难!“起名黑洞”OpenAI 的新模型,到底怎么选?

一句话看懂:o3 以深度推理与工具调用能力领跑复杂任务,GPT-4.1 超长上下文与精准指令执行适合 API 开发,而 o4-mini 则堪称日常任务的「性价比之王」。如果你最近关注 AI 新闻,可能会被各种层出不穷的新模型搞得眼花缭乱。尤其是堪称「起名黑洞」的 OpenAI,命起名来可谓是毫无章法。即便是 AI 圈的资深团队,在面对同时发布的 o3、o4-mini、GPT-4.1、GPT-4.

​人工智能开发平台Hugging Face 收购 Pollen Robotics,加速开源机器人发展

人工智能开发平台Hugging Face宣布收购法国机器人初创公司Pollen Robotics,交易金额未披露。此举标志着Hugging Face首次进军硬件领域,旨在推动开源机器人技术在全球的普及与发展。Pollen Robotics成立于2016年,总部位于法国波尔多,以开发开源人形机器人Reachy2闻名。该机器人定价约7万美元,已被美国康奈尔大学和卡内基梅隆大学等研究机构采用,用于探索机

国行版iPhone即将变身AI手机:iOS 18.5正式版已在路上

快科技4月25日消息,据媒体报道,经过将近一个月的测试,苹果将在5月份推送iOS 18.5正式版。该版本将为国行版iPhone带来Apple智能,目前美版、欧版iPhone都已上线Apple智能,但国行版iPhone仍然缺席。据悉,Apple智能(Apple Intelligence)是一种基于个人场景的生成式AI系统,能提供协助辅助、图像创作等智能化功能。具体来说,Apple智能涵盖了一系列

Otto 推出业界首个 PIMS 集成功能,AI 生成医疗记录再升级

近日,位于德克萨斯州奥斯汀的 Otto 公司宣布推出其 AI 驱动的 Recap 功能的自动写回功能,成为兽医技术领域首个提供与实践信息管理系统(PIMS)无缝集成的 AI 生成 SOAP 笔记的公司。该功能支持与多个流行的 PIMS 系统(包括 Avimark、Cornerstone、Impromed、Neo、eVetPractice、EzyVet 和 Instinct)的同步,意味着兽医们在文

Ray-Ban Meta 智能眼镜正式推出实时翻译功能,支持四种语言和离线使用

IT之家 4 月 24 日消息,Meta 公司今日宣布,将向所有 Ray-Ban Meta 智能眼镜用户推出一项全新的实时翻译功能。此前该功能仅以测试版的形式向部分早期体验用户开放,如今正式面向广大用户推出。据IT之家了解,该实时翻译功能支持英语、法语、意大利语和西班牙语四种语言,用户可以在对话中实时将这些语言相互翻译。只要提前下载了相应的语言包,即使没有 Wi-Fi 或移动网络连接,用户也能够