Pika重磅发布超现实操控技术Pika Twists:AI视频编辑进入全新境界

近日,AI视频生成平台Pika推出了一项革命性的新技术,允许用户以超现实的方式操控视频中的任何角色或物体。这一突破性功能的发布迅速引发了全球创作者的热烈反响。据AIbase了解,Pika的这项技术能够实现高度逼真的视频编辑效果,来自其创作者社区的演示片段令人叹为观止,展现了AI在视频内容创作中的无限可能。超现实操控:视频编辑新体验Pika的新技术通过先进的AI算法,赋予用户前所未有的视频操控能力。

亚马逊推出 Nova Act:可操控网页浏览器的 AI 智能体

感谢IT之家网友 华南吴彦祖 的线索投递!IT之家 4 月 1 日消息,亚马逊于当地时间周一正式发布了其通用人工智能智能体(AI agent) ——Nova Act。该智能体具备操控网络浏览器并自主执行简单网络任务的能力。与此同时,亚马逊还推出了配套的 Nova Act 软件开发工具包(SDK),旨在帮助开发者利用 Nova Act 构建智能体应用原型。据IT之家了解,Nova Act 由亚马

研究称 OpenAI 可能未经授权使用 O'Reilly 付费书籍训练 AI 模型

近日,一项新研究引发关注,指控 OpenAI 在训练其最新的 AI 模型时,使用了 O"Reilly 媒体的付费书籍,但并未获得许可。这项研究由一家名为 AI Disclosures Project 的非营利组织发布,该组织是由媒体大亨 Tim O"Reilly 和经济学家 Ilan Strauss 于2024年共同创办的。AI 模型可以被视为复杂的预测引擎,它们通过大量的数据(包括书籍、电影、电

​谷歌推出个性化语言学习 AI 工具,助你轻松掌握新语言

谷歌宣布推出三项新的人工智能实验,旨在帮助用户以更个性化的方式学习语言。虽然这些实验尚处于初期阶段,但它们显示出谷歌可能正在试图与 Duolingo 等语言学习平台竞争,这些工具得益于谷歌的多模态大语言模型 Gemini。第一个实验名为 “微型课程(Tiny Lesson)”,旨在帮助用户快速学习特定短语,以应对实际情境。用户可以描述所需的场景,例如 “寻找丢失的护照”,系统将根据上下文提供量身定

微软推出三大 AI 新功能,提升 Windows 11 使用体验

在5月6日的最新发布会上,微软宣布了一系列新的 AI 功能,旨在提升 Windows11用户的使用体验。这些功能将在 Copilot+ PC 上首发,并逐步推向所有 Windows11用户。微软引入了一款 AI 代理,帮助用户更便捷地修改 Windows 设置。用户可以直接通过语音或文字向代理说明需求,比如调整鼠标指针或通过语音控制 Windows,代理将理解用户的请求并执行相应任务,但需要用户的

电台用AI DJ当主持人:6个月无人识破!

快科技4月30日消息,澳大利亚知名电台CADA使用AI语音生成器ElevenLabs打造了一位AI DJ Thy。Thy自2024年11月开始主持节目《Workdays with Thy》,其表现如此逼真,以至于在长达六个月的时间里,竟然没有听众发现他并非人类。ElevenLabs的基本原理是,用户只需上传一段录音,ElevenLabs就能生成对应的语音模型,随后输入文字,AI就能用该声音将文

Meta 推 WebSSL 模型:探索 AI 无语言视觉学习,纯图训练媲美 OpenAI CLIP

IT之家 4 月 25 日消息,科技媒体 marktechpost 昨日(4 月 24 日)发布博文,报道称 Meta 公司发布 WebSSL 系列模型,参数规模从 3 亿到 70 亿,基于纯图像数据训练,旨在探索无语言监督的视觉自监督学习(SSL)的潜力。以 OpenAI 的 CLIP 为代表,对比语言-图像模型已成为学习视觉表征的默认选择,在视觉问答(VQA)和文档理解等多模态任务中表现突出

Meta Llama 4 发布 36 小时“差评如潮”,匿名员工爆料拒绝署名技术报告

Meta 最新基础模型 Llama 4 发布 36 小时后,评论区居然是这个画风:失望,非常失望不知道他们后训练怎么搞的,总之不太行在 [各种测试] 中失败……还被做成表情包调侃,总结起来就是一个“差评如潮”。具体来看,大家的抱怨主要集中在代码能力。最直观的要数经典“氛围编程”小球反弹测试,小球直接穿过墙壁掉下去了。反映在榜单上,成绩也相当割裂。发布时的官方测评(LiveCodeBench)分数

​Versa推出MCP服务器,助力AI助手快速安全查询系统

全球领先的通用安全访问服务边缘(SASE)解决方案提供商 Versa 宣布推出其最新的模型上下文协议(MCP)服务器。这一强大的新工具旨在帮助客户将其智能 AI 工具与 VersaONE 通用 SASE 平台无缝集成,从而提升可视性、加速事件解决,并提高运营效率。图源备注:图片由AI生成,图片授权服务商MidjourneyVersa MCP 服务器允许像 Claude、ChatGPT、Gemini

智谱发布 AutoGLM 沉思:首个免费、具备深度研究和操作能力的 AI Agent

IT之家 3 月 31 日消息,IT之家从智谱官方微信公众号获悉,今天智谱在中关村论坛上正式发布 AutoGLM 沉思。官方称,这一全新智能体不仅具备深度研究能力(Deep Research),还能实现实际操作(Operator),真正推动 AI Agent 进入“边想边干”的阶段。AutoGLM 沉思的技术演进路径包括:GLM-4 基座模型 → GLM-Z1 推理模型 → GLM-Z1-Rum

OpenAI o3 / o4-mini 模型 AI 生成文本含特殊符号,推测为隐形水印

IT之家 4 月 22 日消息,AI 初创公司 Rumi 发现 OpenAI 公司在 o3 和 o4-mini 模型中,嵌入了窄不换行空格(Narrow No-Break Space, NNBSP, U+202F)等特殊 Unicode 字符。IT之家注:这些字符在普通视图中与标准空格无异,但在 SoSciSurvey 或 Sublime Text 等专业工具中,可检测其独特代码。Rumi 表示

Character.AI 推出 AvatarFX 模型:AI 实现静转动,让图片角色开口说话

IT之家 4 月 23 日消息,Character.AI 公司今天(4 月 23 日)在 X 平台发布推文,宣布推出 AvatarFX 模型,能够让静态图片中的人物“开口说话”。用户只需上传一张图片并挑选一个声音,平台即可生成会说话、会移动的形象。这些形象还能展现情感,呈现出令人惊叹的真实感和流畅度。公司表示,这得益于一种名为“SOTA DiT-based diffusion video gen

谷歌DeepMind被曝启用“激进”竞业禁止协议 ,离职一年内不得为竞争对手工作

在竞争激烈的人工智能行业中,谷歌的 AI 部门 DeepMind 采取了极端措施,以留住顶尖人才。据《商业内幕》报道,该公司在英国的部分 AI 员工签署了 “激进” 的竞业协议,这意味着这些员工在离职后的一年内不得为竞争对手工作。这种协议不仅限制了员工的职业选择,还让他们在这一年中无法参与行业内快速发展的技术进步。有报道称,这些员工在协议期间仍会领取工资,实际上相当于一段长达一年的带薪休假。然而,

Genspark AI幻灯片工具发布,革新专业演示文稿创作

Genspark推出全新AI幻灯片工具,旨在通过人工智能简化专业演示文稿的创作流程。据AIbase了解,该工具能够快速整合复杂多格式数据、自动生成综合报告,并支持交互式修改与多样化艺术风格,显著提升演示文稿的质量与效率。Genspark的这一创新已在开发者与企业用户中引发热烈反响,项目详情通过Genspark官网与GitHub公开。视频来自官方,翻译:小互核心功能:智能整合与交互式创作Genspa

​马斯克的xAI宣布以 450 亿美元收购社交平台 X

近日,马斯克的人工智能创业公司 xAI 正式宣布以一项全股票交易收购社交媒体平台 X,交易金额高达约450亿美元。这一数字中包含120亿美元的债务,使得 X 的隐含股权价值达到330亿美元。马斯克在 X 平台上发表声明表示,此次合并将 “结合两家公司在数据、模型、计算、分发和人才方面的优势”,他认为这种组合将通过将 xAI 的先进 AI 能力与 X 的巨大用户基础相结合,释放出巨大的潜力。两家公司

人工智能无人机在国际竞速比赛中首次战胜人类飞行员冠军

IT之家 4 月 29 日消息, 4 月 14 日在阿布扎比举行的 2025 年 A2RL 无人机锦标赛上,由代尔夫特理工大学(Delft University of Technology)开发的人工智能(AI)无人机首次战胜了人类飞行员。当天,两场无人机竞速赛事同时举行:人类飞行员参与的猎鹰杯(Falcon Cup)总决赛,以及 AI 驱动的自动驾驶无人机竞速赛事。在最终的对决中,代尔夫特理工

AI广告存在误导性,苹果美国官网撤下AI功能“现已推出”字样

近日,苹果公司官网的 “Apple Intelligence” 页面发生了显著变化。用户在访问该页面时,会发现 “Available Now(现已推出)” 这一字眼已被悄然移除。这一调整的背后,原因引发了广泛关注。据报道,美国广告审查机构 NAD(National Advertising Division)发布公告,指出苹果的 AI 广告存在误导性。苹果在宣传其 AI 功能时,没有添加任何限定词,

​Tinder 推出 AI 互动游戏,帮助用户提升调情技巧!

在当前竞争激烈的在线约会市场,Tinder 近日推出了一款全新的 AI 互动游戏,旨在帮助用户提升调情能力。该游戏名为 “The Game Game”,于本周二正式上线,用户可以通过与 AI 机器人互动,练习调情、模拟初次相遇场景,并根据表现获得评分和建议。要参与这个游戏,用户只需在 Tinder 应用程序中点击左上角的 Tinder 标志。游戏为用户提供了一副卡牌,每张卡牌上都展示了不同的 AI

全球首个人形机器人半程马拉松在北京鸣枪开跑 天工机器人夺冠

北京,2025年4月19日——今天,全球首个人形机器人半程马拉松在北京经济技术开发区(亦庄)正式开赛,标志着机器人技术与体育竞技的创新融合迈出历史性一步。本次赛事吸引了近20支来自全球的人形机器人赛队,与人类选手同场竞技,共同挑战21.0975公里的半程马拉松赛道。“天工”机器人以2小时40分42秒的优异成绩率先冲线,夺得冠军,引发广泛关注和热议。赛事概况2025北京亦庄半程马拉松暨人形机器人半程

OpenAI CEO 奥尔特曼:DeepSeek 并未影响 GPT 的增长,将推更好的开源模型

IT之家 4 月 14 日消息,在日前举行的 TED 2025 上,OpenAI CEO 萨姆・奥尔特曼表示,“DeepSeek 的出现并未影响 GPT 的增长,将推出更好的开源模型。”市场调查机构 App Figures 日前报告,2025 年 3 月全球非游戏应用下载量方面,ChatGPT 以 4600 万次力压 Instagram 和 TikTok,成为全球下载量最高(仅统计苹果 App