字节跳动

字节跳动发布高效预训练长度缩放技术,突破长序列训练瓶颈

字节跳动宣布推出高效预训练长度缩放技术(Efficient Pretraining Length Scaling),通过创新的Parallel Hidden Decoding Transformer(PHD-Transformer)框架,显著提升大语言模型(LLM)在长序列预训练中的效率与性能。据AIbase了解,该技术在保持推理效率的同时,支持高达2048K(2M)的上下文长度训练,解决了传统框

字节跳动开源Liquid多模态模型,革新视觉与语言统一生成

人工智能领域迎来一项重大突破。AIbase从社交媒体获悉,字节跳动于近日宣布开源其全新多模态生成模型Liquid,该模型以创新的统一编码方式和单一大语言模型(LLM)架构,实现了视觉理解与生成任务的无缝整合。这一发布不仅展示了字节在多模态AI上的技术雄心,也为全球开发者提供了强大的开源工具。以下是AIbase对Liquid模型的深度解析,探索其技术创新、核心发现及行业影响。Liquid模型亮相:统

大动作!字节AI Lab并入Seed,AI布局迎新变

据AI科技评论消息,近日字节AI Lab即将全部并入Seed团队,这一变动标志着字节内部AI研发架构迎来重大调整。据悉。字节AI Lab成立于 2016 年,曾是字节跳动AI研发的核心部门,由马维英负责,直接向张一鸣汇报。当时团队规模达 150 人,研究覆盖人工智能前沿技术,字节的推荐算法、短视频特效等都源于此,为抖音等产品的崛起立下汗马功劳,也助力字节在国内AI领域领先。但后来随着抖音、TikT

字节Seedream 3.0 文生图模型技术报告发布:多项性能大幅升级

字节跳动Seed团队正式发布了Seedream3.0文生图模型的技术报告。这一模型在性能上实现了重大提升,是一个原生高分辨率、支持中英双语的图像生成基础模型,在分辨率、生图结构准确性等多方面取得突破,与上一版本相比优势显著。Seedream3.0在不同维度上的表现。本图各维度数据以最佳指标为参照系,已进行归一化调整。在功能亮点上,Seedream3.0可原生2K直出,无需后处理就能输出高分辨率图像

AI日报:ChatGPT重磅上线图像库功能;白嫖!Veo2登陆谷歌AI Studio;蚂蚁百宝箱推“MCP专区”

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、报道称字节跳动整合 AI 研发团队,AI Lab 即将并入 Seed字节跳动正在进行AI研发团队的整合,将独立的字节AI Lab并入Seed团队。这一举措体现了字节在AI领域

报道称字节跳动整合 AI 研发团队,AI Lab 即将并入 Seed

据雷峰网的 “AI 科技评论” 报道,字节跳动正在对其 AI 研发团队进行整合,原本独立的字节 AI Lab 即将全部并入 Seed 团队。这一变化标志着字节跳动在 AI 领域战略布局的进一步调整。字节 AI Lab 成立于2016年,最初由微软亚洲研究院的前常务副院长马维英负责,并直接向公司创始人张一鸣汇报。AI Lab 的主要任务是开发能够为字节跳动内容平台提供服务的创新技术,包括推荐算法和短

字节跳动发布Seaweed-7B视频模型,AI视频生成迈向新高度

人工智能视频生成领域迎来新的里程碑。AIbase从社交媒体获悉,字节跳动近期发布了其全新视频生成模型Seaweed-7B的论文与演示,展示了一系列突破性功能,包括音视频同步生成、长镜头叙事和实时高分辨率生成。这一发布标志着字节跳动在AI视频技术上的加速布局,以下是AIbase对Seaweed-7B的深度报道,解析其技术亮点与行业影响。Seaweed-7B震撼亮相:多功能视频生成Seaweed-7B

提升大模型自动修Bug能力 豆包正式开源首个多语言类SWE数据集

快科技4月10日消息,今日,字节跳动豆包大模型团队宣布,正式开源首个多语言类SWE数据集Multi-SWE-bench,可用于评估和提升大模型自动修 Bug”能力。在SWE-bench基础上,Multi-SWE-bench首次覆盖Python之外的7种主流编程语言(Java、Go、Rust、C、C、TypeScript、JavaScript),是真正面向全栈工程”的评测基准。Multi-SWE

传字节跳动AI眼镜有新动作! 已和供应商“搭上线”

快科技4月13日消息,近日,有媒体报道,有知情人士透露了字节跳动在AI硬件领域的又一重大布局计划推出自家的AI智能眼镜。据悉,字节跳动自去年起便已启动AI眼镜项目。公司积极招募具备硬件设计经验的工程师加入开发团队,全力攻克技术难题。其中,如何在不显著影响电池续航的情况下,保障眼镜拍摄出高质量的图像和视频,成为亟待解决的关键问题。目前,该产品的核心功能仍处于保密阶段,具体推出时间和销售地区也尚未

字节跳动推出Vidi多模态模型,引领超长视频理解与编辑新潮流

字节跳动宣布推出全新多模态模型Vidi,专注于视频理解与编辑,首版核心能力为精准的时间检索功能。据AIbase了解,Vidi能够处理视觉、音频和文本输入,支持长达一小时的超长视频分析,在时间检索任务上性能超越GPT-4o与Gemini等主流模型。这一突破性技术已在AI社区引发热烈讨论,相关细节通过字节跳动官方渠道与GitHub公开。核心功能:精准时间检索与多模态协同Vidi以其强大的时间检索与多模