超强AI电商购物助手!Add To Cart AI:可理解文本、语音、图像,帮用户找到产品

在当今快速发展的电商行业中,AI电商购物助手发展也备受关注。Add To Cart AI 是一款专为电商平台设计的 AI 驱动购物助手,旨在帮助消费者更快找到心仪产品,同时提升商家的转化率和销售额。它可以理解文本、语音、图像甚至实时视频的代理。Add To Cart AI 的最大亮点在于它能够瞬间将购物清单、聊天记录和图片转化为完整的购物车。这意味着消费者在寻找心仪商品时,无需繁琐的操作,只需提供

RAG增强系统Node:AI检索革命,效率飙升30%!

随着生成式人工智能技术的飞速发展,检索增强生成(Retrieval-Augmented Generation, RAG)系统正成为提升大语言模型(LLM)准确性和上下文相关性的关键技术。近日,一款名为NodeRAG的创新RAG增强系统引起了业界广泛关注,其独特的异构图结构为RAG工作流带来了革命性突破。NodeRAG:异构图驱动的RAG新范式NodeRAG是一个以图结构为核心的RAG框架,通过引入

谷歌 Gemini 推出视频分析功能,能准确识别视频拍摄场所

近日,科技媒体 Android Authority 报道称,谷歌最新的 Gemini 聊天机器人引入了一项引人注目的新功能 —— 视频分析。用户现在可以轻松上传视频并提问,Gemini 会基于视频内容进行智能分析,回答相关问题。这一创新功能无疑为视频内容的处理带来了新的可能性,吸引了广大用户的关注。在测试中,Gemini 展现出了惊人的能力。通过分析视频中的建筑风格和地理线索,AI 能够准确判断出

颠覆性开源 TTS 模型 Dia 发布:情绪、非语言提示全支持,媲美真人对话

一家名为 Nari Labs 的两人创业公司发布了 Dia,这是一个拥有16亿参数的文本转语音 (TTS) 模型,旨在直接从文本提示生成自然对话。其联合创始人 Toby Kim 声称,Dia 的性能超越了 ElevenLabs 等竞争对手的专有产品以及谷歌的 NotebookLM AI 播客生成功能,并可能对 OpenAI 近期发布的 gpt-4o-mini-tts 构成威胁。Kim 在社交媒体

OpenUtau – 开源的AI歌声合成工具,自动适配系统语言

OpenUtau是什么OpenUtau 是开源的歌声合成工具,兼容 UTAU 音源库和重采样器,支持 VSQX 导入、多语言界面及预渲染功能,帮助创作者快速预览作品节省时间。OpenUtau现代化的界面和丰富的编辑功能,如音素器、颤音编辑器等,让音乐创作更加直观高效。OpenUtau 支持 Windows、macOS 和 Linux 系统,开箱即用,适合音乐创作者和歌声合成爱好者。Open

昆仑万维开源 SkyReels-V2 模型,开启生成“无限时长”视频时代

IT之家 4 月 21 日消息,昆仑万维今日正式发布并开源 SkyReels-V2—— 全球首个使用扩散强迫(Diffusion-forcing)框架的无限时长电影生成模型,其通过结合多模态大语言模型(MLLM)、多阶段预训练(Multi-stage Pretraining)、强化学习(Reinforcement Learning)和扩散强迫(Diffusion-forcing)框架来实现协同优

深圳大学人工智能学院正式揭牌成立,打造本硕博一体化 AI 人才培养体系

IT之家 4 月 21 日消息,据深圳卫视深视新闻报道,深圳大学人工智能学院今日正式揭牌成立。学院建设基础学科研究中心和算力平台,与腾讯云共建产业学院。目前该学院包含 2 位中国科学院院士、1 位日本工程院院士、5 位国家级人才、2 位国家青年人才的约 80 人教研团队。学院以创新的学科布局,构建起全面的本硕博一体化专业体系,学科方向覆盖人工智能基础理论、具身智能等前沿。学院秉持“厚基础、重交叉

TrendForce:预计中国市场 2025 年人形机器人本体产值将超 45 亿

IT之家 4 月 21 日消息,TrendForce 集邦咨询今日发文,中国市场已有 11 家主流人形机器人本体厂商在 2024 年开启量产计划,其中有 6 家如宇树科技、优必选、智元机器人、银河通用、众擎机器人、乐聚机器人等厂商对 2025 年量产规划超过千台。IT之家从报告获悉,预计中国市场 2025 年人形机器人本体产值将超过 45 亿元人民币,加上马斯克关于 Tesla Optimus

选 AI 比选对象还难!“起名黑洞”OpenAI 的新模型,到底怎么选?

一句话看懂:o3 以深度推理与工具调用能力领跑复杂任务,GPT-4.1 超长上下文与精准指令执行适合 API 开发,而 o4-mini 则堪称日常任务的「性价比之王」。如果你最近关注 AI 新闻,可能会被各种层出不穷的新模型搞得眼花缭乱。尤其是堪称「起名黑洞」的 OpenAI,命起名来可谓是毫无章法。即便是 AI 圈的资深团队,在面对同时发布的 o3、o4-mini、GPT-4.1、GPT-4.

行业首款,智元发布具身智能一站式开发平台 Genie Studio

感谢IT之家网友 Skyraver 的线索投递!IT之家 4 月 21 日消息,智元机器人今日发布行业首款面向具身智能开发者的一站式开发平台 Genie Studio(Genie Studio 官网入口)。据介绍,Genie Studio 是智元机器人专为具身智能场景打造的一站式开发平台,具备数据采集、模型训练、仿真评测、模型推理的全链路产品能力,让“采”、“训”、“测”、“推”每个环节都能找