1至5元不等!有人开始售卖ChatGPT生成的“吉卜力风格”图片了

短短几天内,通过 ChatGPT 生成的动画风格图片数量竟然超过了 7 亿张,在带来巨大人气的同时,质疑声也愈发高涨了。不仅存在着版权方面的争论,肖像权相关的讨论也一直没有间断。这次,又新增了“非法盈利”的争议……站长之家(ChinaZ.com)4 月 7 日 消息:最近,SNS上出现了售卖吉卜力风格图片的“交易”,一些二手交易平台上声称收到钱后就会帮忙制作吉卜力风格图片的帖子也层出不穷。吉卜

颠覆性开源 TTS 模型 Dia 发布:情绪、非语言提示全支持,媲美真人对话

一家名为 Nari Labs 的两人创业公司发布了 Dia,这是一个拥有16亿参数的文本转语音 (TTS) 模型,旨在直接从文本提示生成自然对话。其联合创始人 Toby Kim 声称,Dia 的性能超越了 ElevenLabs 等竞争对手的专有产品以及谷歌的 NotebookLM AI 播客生成功能,并可能对 OpenAI 近期发布的 gpt-4o-mini-tts 构成威胁。Kim 在社交媒体

Runway发布图像一致性参考功能 Gen-4 References 支持提取人物、场景或风格特征及多图混合

Runway于近日正式推出Gen-4References功能,为其AI视频生成模型Gen-4新增了图像一致性参考能力。这一功能允许用户通过上传参考图像,提取人物、场景或风格特征,并在生成内容中保持高度一致性,支持多张图像混合生成,为AI视频创作带来了前所未有的控制力与创意自由。核心功能解析:多图像融合与一致性控制Gen-4References的核心在于其强大的图像参考与风格嵌入能力。用户可上传1至

Anthropic揭秘Claude“内心世界”:AI显微镜下的九大奇妙发现

近日,人工智能研究公司Anthropic发布了一项令人振奋的研究成果,通过其研发的“AI显微镜”技术,首次深入探索了旗下语言模型Claude的内部思考过程。这项研究不仅揭示了AI在处理信息时的复杂机制,还发现了九种令人意想不到的行为模式。这些发现如同打开了一扇窗,让我们得以窥见AI“思维”的温暖与奇妙,为未来构建更可靠、更透明的智能系统点亮了希望之光。首先,研究团队发现Claude拥有一种“通用语

黄仁勋揭秘自己如何用 AI 学习:先让“老师”把自己当成 12 岁小孩

IT之家 5 月 7 日消息,据《商业内幕》今日报道,现在的英伟达 CEO 黄仁勋不仅正在打造先进 AI 模型所需的核心芯片,还把这些 AI 模型当成了自己的私人导师。当地时间周二,黄仁勋出席了第 28 届米尔肯研究院全球大会的一个小组讨论会并发表讲话,谈及 ChatGPT、Gemini Pro 和 Perplexity 等工具时,黄仁勋表示:“我每天都在用它们学习。对那些我不熟悉的领域,我会先

OpenAI 部署新监控系统,防范 o3 和 o4 - mini 提供生物和化学威胁建议

IT之家 4 月 17 日消息,人工智能公司 OpenAI 宣布部署了一套新的监控系统,专门用于监测其最新的人工智能推理模型 o3 和 o4-mini,防止这些模型提供可能引发生物和化学威胁的有害建议。根据 OpenAI 的安全报告,该系统旨在确保模型不会为潜在的有害攻击提供指导。据 OpenAI 表示,o3 和 o4-mini 相比之前的模型在能力上有显著提升,但同时也带来了新的风险。根据 O

人类一生所学不过 4GB,加州理工顶刊新研究引热议

24 小时不间断学习且不遗忘,一辈子也只有 4GB 的“知识储量”?科学家们最新研究,计算出了人类学习积累上限,就这么多~~(甚至还不如一块 U 盘能装)。这是来自 Cell 旗下神经科学顶刊 Neuron 上的一项工作,它提出了一个发人深省的悖论:人类信息处理速度仅为每秒 10bit,而我们的感官系统却能以每秒 10 亿 bit 的速率收集数据。由此,按照每秒 10bit 的速度来算,人类 2

小鹏汽车推新物理大模型,定位AI汽车公司

近日,小鹏汽车创始人何小鹏在社交媒体上透露,作为将 “智能化” 作为核心的车企之一,小鹏汽车的本质定位在于 “AI 汽车公司”。他强调,人工智能(AI)最大的价值不仅在于数字世界的应用,更在于能够改变我们的物理世界。这一观点引发了行业内外的关注与讨论。何小鹏表示,小鹏汽车坚持全栈自研的理念,去年首次在自动驾驶领域引入了强化学习与模型蒸馏的技术路线,这一创新举措使得小鹏在行业内具备了独特竞争力。他透

图像生成框架VisualCloze发布:通过视觉上下文学习实现高度灵活的图像生成

人工智能在图像生成领域的创新步伐从未停歇。近日,Hugging Face平台上线了一款名为VisualCloze的全新工具,以其独特的视觉上下文学习(Visual In-Context Learning)技术,标志着通用图像生成框架的又一重大突破。AIbase通过整理社交媒体上的最新动态,深入剖析这一工具的亮点与潜力,为读者带来第一手报道。VisualCloze亮相:通用图像生成的全新范式Visu

大模型“自动修 bug”能力将提升,豆包团队开源首个多语言代码修复基准 Multi-SWE-bench

感谢IT之家网友 Skyraver 的线索投递!IT之家 4 月 10 日消息,豆包大模型团队今日通过官方公众号宣布,首个多语言类 SWE 数据集 Multi-SWE-bench 现已正式开源,可用于评估和提升大模型“自动修 Bug”能力。在 SWE-bench 基础上,Multi-SWE-bench 首次覆盖 Python 之外的 7 种主流编程语言,是真正面向“全栈工程”的评测基准。其数据

MCP协议和Function Calling 、 AI Agents的区别是什么?MCP优势有哪些

MCP(模型上下文协议)、Function Calling 和 AI Agents 是三种重要的技术手段,它们在实现 AI 模型与外部系统交互方面各有特点。本文将详细对比这三种技术,并深入探讨 MCP 的多项显著优势。MCP、Function Calling 和 AI Agents 的区别Function Calling:平台依赖的函数调用机制Function Calling 是一种 AI 模

AI生命科学基础大模型再升级:百图生科发布“发现助手”,加速抗体研发与精准治疗

近日,百图生科在其发布会上推出了全球首个AI生命科学基础大模型驱动的生成式发现系统,首次全面展示了AI驱动的全链路创新体系。这一系统基于百图生科的全模态生物大模型xTrimo V3,并结合生成式AI技术,力图提高生命科学领域的研发效率与业务整合度。百图生科自2024年10月发布的xTrimo V3,以2100亿参数刷新了全球最大生命科学AI模型的纪录,成为此次发布的核心技术。凭借这一技术,百图生科

德国商业银行推AI虚拟助手Ava,革新数字银行体验

德国商业银行(Commerzbank)近日宣布推出一款名为 Ava 的人工智能虚拟助手,旨在为私人及小型企业客户提供自然流畅的交流体验。Ava 的推出是该行经过18个月研发的成果,运用微软 Azure OpenAI 服务的先进 GPT 模型,能够与客户进行高效互动。作为一款创新的数字助手,Ava 可以通过自然语言与用户进行对话,提供关于银行服务的普遍信息和个性化建议。无论是想了解银行产品,还是需要

Krea 上线3D 功能并重构网站:从文本到立体,创作秒成型

近日,生成式 AI 平台 Krea 宣布推出3D 生成功能,并同步完成网站界面的全面重构。这标志着 Krea 在技术创新与用户体验上的双重突破,进一步巩固其在创意工具领域的领先地位。  新上线的3D 生成功能是此次更新的核心亮点。用户可通过文本描述或2D 图像快速生成可交互的3D 对象,实时调整角度、光影与纹理。这一功能基于 Krea 自研 AI 模型和内部 GPU 集群,速度快、稳定性高,大幅降

奥尔特曼:OpenAI 正逐步撤回 GPT-4o“过于奉承”的更新

IT之家 4 月 30 日消息,OpenAI 正在撤回最新的 GPT-4o 更新,此前 CEO 奥尔特曼称,近期更新使聊天机器人的个性变得“过于阿谀奉承和烦人”,公司将进行修复。奥尔特曼今日凌晨在 X 上表示,免费版 ChatGPT 用户的回退已经“完全完成”,预计付费用户的回退“今天也能完成”。他还透露:“我们正在调整模型的个性,未来几天会发布更多更新。”OpenAI 在上周五推出了 GPT-

DeepCoder-14B发布:开源AI编码神器媲美o1与o3-mini,解锁技术新边界

近日,一款名为“DeepCoder-14B”的全新AI模型正式亮相,这一由Agentica团队与合作伙伴共同打造的开源项目迅速引发了全球科技界的热议。作为一款专为编码推理设计的生成式AI模型,DeepCoder-14B以其卓越的性能跻身行业顶尖水平,据称可与OpenAI的o1和o3-mini相媲美。更令人振奋的是,研发团队不仅开放了模型本身,还一并发布了其完整数据集、源代码和训练方法,这一罕见的透

以色列拥抱 AI 辅导 eSelf 为学生打造一对一虚拟导师

以色列有望成为全球首个在全国范围内实施人工智能辅导的国家。初创公司 eSelf 与以色列最大的 K-12教科书出版商教育技术中心 (CET) 合作,为全国学生提供个性化的 AI 私人导师。哈佛大学将担任该试点项目的学术顾问,评估其教育框架和影响。首阶段试点将于5月启动,预计将有1万名学生参与。这项合作旨在解决当前教育面临的两大挑战:学生成绩下滑和全球教师短缺。研究表明,一对一辅导能显著提高学生成绩

​2024 年全球移动发行商收入榜单发布OpenAI 首次上榜

Sensor Tower 正式发布了《2024年全球移动发行商收入 TOP50》榜单,引发了行业内的广泛关注。根据报告,2024年全球消费者在移动应用市场的付费总额首次突破了1500亿美元,约合1.09万亿元人民币,同比增长达13%。在今年的榜单中,腾讯再次以绝对优势稳居第一,继续引领全球移动发行商。这得益于腾讯在游戏、社交及其他多个领域的全生态布局,其产品线丰富,用户基础庞大。紧随其后的是字节跳

50 → 100 条:OpenAI 放宽限制,Plus 等用户每周可用 o3 AI 模型消息数翻倍

IT之家 4 月 24 日消息,OpenAI 公司首席执行官山姆・奥尔特曼(Sam Altman)今天(4 月 24 日)在 X 平台发布推文,宣布针对 Plus、Team 或 Enterprise 用户,放宽模型消息限制,o3 从每周 50 条升至每周 100 条,o4-mini 从每日 150 条升至每日 300 条,o4-mini-high 升至每天 100 条。IT之家此前报道,Open

谷歌重申今年 750 亿美元资本支出计划:斥巨资购买芯片、服务器,持续押注生成式 AI

IT之家 4 月 10 日消息,据路透社报道,谷歌母公司 Alphabet 公司周三重申,计划今年投入约 750 亿美元(IT之家注:现汇率约合 5519.45 亿元人民币)扩建数据中心,继续押注生成式 AI,尽管回报尚不明朗,且全球贸易战可能带来成本上升的压力。Alphabet 首席执行官桑达尔・皮查伊在谷歌云计算部门的年度会议上表示,这项投资将用于采购所需的芯片和服务器,强化公司核心业务(如