Character.AI 推出 AvatarFX 模型:AI 实现静转动,让图片角色开口说话

IT之家 4 月 23 日消息,Character.AI 公司今天(4 月 23 日)在 X 平台发布推文,宣布推出 AvatarFX 模型,能够让静态图片中的人物“开口说话”。用户只需上传一张图片并挑选一个声音,平台即可生成会说话、会移动的形象。这些形象还能展现情感,呈现出令人惊叹的真实感和流畅度。公司表示,这得益于一种名为“SOTA DiT-based diffusion video gen

支持语音控制,坚果 N3 三色激光变焦投影仪接入小米米家 App

IT之家 4 月 22 日消息,小米科技有限责任公司官方公众号“米家 App”今日宣布,坚果 N3 投影仪接入米家 App(仅 N3 单型号支持米家互联),支持小米澎湃智联、超级小爱控制等。据介绍,用户可通过米家 App 控制坚果 N3 三色激光变焦投影仪,包括手机遥控等。同时投影仪也支持小爱同学语音控制,可执行关闭投影仪、调整音量等操作。据IT之家此前报道,坚果投影本月(4 月 9 日)推出了

​哥伦比亚大学退学生开发 “AI面试作弊神器”Interview Coder ,成功融资500万美元

近日,哥伦比亚大学的两位退学生 Chungin “Roy” Lee 和 Neel Shanmugam 联合创办的初创公司 Cluely,宣布完成530万美元的种子轮融资,投资方包括 Abstract Ventures 和 Susa Ventures。Cluely 主要推出了一款名为 Interview Coder 的 AI 工具,该工具被称为 “面试作弊神器”,能够在各种场景中帮助用户隐秘使用人工

2025年AI视频生成企业TOP20榜单出炉:可灵AI、即梦AI、PixVerseAI位居前三

近日,由 DBC、CIW 和 CIS 联合发布的 “2025年 AI 视频生成企业 TOP20” 榜单正式出炉,快手旗下“可灵AI”、爱诗科技“PixVerseAI”及抖音“即梦AI”占据前三席位。另外,阿里巴巴(通义万相、绘蛙AI视频)、腾讯(智影)、科大讯飞(讯飞绘镜)、MiniMax(海螺AI)等多家企业均榜上有名。

使用礼貌用语可能导致 OpenAI 每年损失数百万美元

最近,关于向人工智能聊天机器人如 ChatGPT 使用礼貌用语可能导致 OpenAI 每年损失数百万美元的新闻引发了广泛关注。这一说法源自 OpenAI 首席执行官山姆・阿尔特曼(Sam Altman)的一条社交媒体评论,迅速引起了众多媒体的热议。事情的起因是一位网友在社交平台上询问阿尔特曼:“用户对 AI 说‘请’和‘谢谢’到底让 OpenAI 在电费上损失了多少?” 对此,阿尔特曼幽默地回应:

​亚马逊跟随微软暂停雄心勃勃的部分国际AI数据中心计划

根据美国两家银行 Wells Fargo 和 TD Cowen 的最新报告,亚马逊已暂停了一些国际数据中心的谈判,主要集中在欧洲。这一消息传出不久,微软也被曝出暂停或取消部分计划。Wells Fargo 的报告指出:“目前尚不清楚暂停的具体范围,但这一举措与微软最近的动态非常相似 —— 它们正在消化近期的激进租约。” 该报告强调,微软似乎仍在推进已签署的交易。图源备注:图片由AI生成,图片授权服务

初创公司 Brellium 获 1670 万美元融资,助力医疗记录审核的智能化升级

初创公司 Brellium 近日宣布获得1670万美元的 A 轮融资,资金将用于扩大其基于人工智能的医疗记录审核解决方案。这一技术旨在帮助医疗机构自动化临床质量管理和保险合规,从而提升医疗服务的效率与准确性。Brellium 的联合创始人扎克・罗森(Zach Rosen)在一次个人经历中深刻感受到医疗文档的疏漏可能对患者造成的严重影响。多年前,他因医疗误诊而经历了长达两年的挫折,频繁奔波于各类专家

JEDEC 发布 HBM4 标准,助力 AI 和高性能计算新时代

JEDEC 固态技术协会宣布推出备受期待的高带宽内存(HBM)标准 ——HBM4。作为 HBM3标准的进化版本,HBM4旨在进一步提升数据处理速度,同时保持更高的带宽、能效及单个芯片或堆叠的更大容量,满足对大数据集和复杂计算的高效处理需求。HBM4标准带来了多项关键技术改进,适用于生成式人工智能、高性能计算、高端显卡及服务器等应用。首先,HBM4的带宽大幅提升,支持每秒高达8Gb 的传输速率,通过

Claude-3 IQ首超人类平均水平,Anthropic引领AI智能新纪元

Anthropic的Claude-3模型在IQ测试中取得突破性进展,平均得分首次超过人类标准值100,成为AI发展史上的里程碑。据AIbase了解,Claude-3在挪威Mensa IQ测试中的表现优于其前代模型,标志着AI在认知能力上的显著飞跃。社区分析指出,这一成就不仅反映了Anthropic的技术实力,还引发了对AI未来发展的广泛讨论。相关数据与预测已在多个技术论坛公开,AIbase为您带来

OpenAI 推出 macOS ChatGPT 新功能,助力编程与搜索更高效

近日,OpenAI 为 macOS 版 ChatGPT 推出了一项强大的集成功能,使用户在进行搜索、写作和编程等任务时更加便捷。此项更新在 AppleInsider 等外媒的关注下正式发布,标志着 ChatGPT 与 macOS 应用的互动进入新阶段。早在今年3月,OpenAI 就推出了名为 “Work with Apps on macOS” 的功能,旨在提升 ChatGPT 与 macOS 应用

Ahrefs 震撼报告:谷歌 AI 概览致网站点击率暴跌34.5%

知名 SEO 工具提供商 Ahrefs 近期发布一项研究,揭示了谷歌 AI 概览功能对搜索结果页面(SERP)点击率的显著负面影响。研究数据显示,当搜索结果中出现 AI 概览时,相关关键词的平均点击率骤降34.5%。该研究选取了 Ahrefs 关键词资源管理器数据库中的30万个关键词,其中一半触发了 AI 概览,另一半则未触发。通过对比2024年3月(AI 概览推出前)和2025年3月(推出后)的

AI治理能力提升!抖音一季度封禁黑产账号260万个

抖音发布《2025第一季度黑产治理数据报告》,显示其在打击黑色产业链方面取得显著成效。报告显示,抖音在第一季度封禁了260万个涉及水军、欺诈和违规导流的黑产账号,并将涉嫌违法犯罪的线索上报给有关部门。抖音通过构建以 AI 为核心的治理体系,显著提升了在黑产违规场景的巡检、预警、研判等环节的效率。在水军治理方面,抖音利用 AI 能力搭建智能机器人工具,实现了风险发现、预警、巡检、研判和回扫等环节的自

全球首个自回归视频生成大模型 MAGI-1 重磅发布,Swin Transformer 团队引领视频创作新潮流

在视频生成领域,最近涌现出了一位强劲的新选手 ——MAGI-1。这款由马尔奖和清华特奖得主曹越领导的创业公司 Sand AI 推出的自回归视频生成大模型,正在重新定义视频创作的可能性。MAGI-1通过预测视频块的序列来生成视频,以其自然流畅的效果和多个可下载版本引发广泛关注。MAGI-1在生成视频时具有诸多优越性能。首先,它提供了无缝流畅的视频体验,能够生成连续的长视频场景,没有尴尬的剪辑或突兀的

全球首款!Ainos AI 鼻成功植入ugo人形机器人,机器拥有“嗅觉”

人工智能气味数字化领导者 Ainos.宣布,其专有的 AI Nose 嗅觉模块已成功安装到日本顶级服务机器人公司 ugo, Inc. 开发的人形机器人上。此次于2025年4月9日完成的安装,标志着全球首个具备功能性嗅觉的机器人诞生,为机器人技术、人工智能和人机交互开创了全新纪元。图源备注:图片由AI生成,图片授权服务商MidjourneyAinos 的 AI Nose 系统整合了高精度气体传感器阵

腾讯云发布座舱端侧大模型,车载 AI 迎来“边开边提醒”时代

在4月22日上海车展开幕前夕的 TIME DAY 腾讯智慧出行技术开放日上,腾讯云重磅推出全新的座舱端侧大模型。该模型基于腾讯混元2B 小参数模型打造,并结合汽车行业专业知识数据进行精细调整和本地知识检索增强(RAG),旨在实现通用及车载知识领域的精准问答。借助该座舱端侧大模型,车辆能够为用户提供包括驾驶行为建议、车辆操作指导、故障处理以及潜在驾驶安全风险提醒等实时服务,真正实现“边开边提醒”的智

真我推出首款 AI 翻译耳机 Bud Air7 Pro,支持 32 种语言翻译!

真我手机官方微博宣布,其首款 AI 翻译耳机 Bud Air7Pro 即将于4月23日下午16时正式上市。这款耳机将搭载讯飞的星火认知大模型4.0Ultra,具备强大的翻译能力,不仅能够支持中文与32种语言的面对面翻译,还具备同声传译功能,为用户的跨语言交流提供了极大的便利。这款耳机的发布将与真我 GT7手机的新品发布会一起进行,届时将展示更多创新技术。真我 GT7手机搭载的是天玑9400+ 芯片

腾讯混元3D AI引擎2.5即将揭晓,3D生成技术再升级

腾讯宣布将于明日正式揭晓混元3D AI引擎2.5(Hunyuan3D AI Engine2.5),进一步推动AI驱动的3D内容创作革新。据AIbase了解,作为混元3D2.0的升级版本,2.5预计在几何生成、纹理合成与生成速度上实现重大突破,为游戏开发、虚拟现实与创意设计等领域带来更高效的解决方案。腾讯官方预告引发了全球开发者与创作者的热烈期待,相关细节将在明日发布会公布。AIbase为您带来最新

Manus开源平替!Kortix-AI正式发布开源通用AI智能体平台Suna

Kortix-AI正式发布开源通用AI智能体平台Suna,定位为热门AI工具Manus的开源替代品。据AIbase了解,Suna集成了浏览器自动化、文件管理、网络爬虫、扩展搜索、命令行执行、网站部署及API集成等功能,通过自然语言对话实现复杂任务的自动化处理。项目已在GitHub上线,凭借其强大的功能集与开源特性,迅速成为AI开发者和自动化爱好者的关注焦点。核心功能:多维能力驱动智能自动化Suna

Character.AI 推出 AvatarFX 模型:让静态图片中的人物“开口说话”

Character.AI 近日宣布推出全新视频生成模型 AvatarFX,这一突破性技术能够将静态图片转化为具有真实感的可说话视频角色,赋予图像中的人物动态表情、唇部同步以及自然肢体动作。AvatarFX 的核心是其最先进的基于扩散模型的动态生成技术。该技术依托经过精心筛选的数据集进行训练,融合了创新的音频条件化、蒸馏和推理策略,使得用户能够以极高的速度生成高保真、时间一致性强的视频。无论是长序列

Genspark AI幻灯片工具发布,革新专业演示文稿创作

Genspark推出全新AI幻灯片工具,旨在通过人工智能简化专业演示文稿的创作流程。据AIbase了解,该工具能够快速整合复杂多格式数据、自动生成综合报告,并支持交互式修改与多样化艺术风格,显著提升演示文稿的质量与效率。Genspark的这一创新已在开发者与企业用户中引发热烈反响,项目详情通过Genspark官网与GitHub公开。视频来自官方,翻译:小互核心功能:智能整合与交互式创作Genspa