AWS 发布 SWE-PolyBench:评估 AI 编程助手的新开源基准

近日,AWS AI Labs 推出了 SWE-PolyBench,这是一个多语言的开源基准,旨在为 AI 编程助手的评估提供一个更全面的框架。随着大规模语言模型(LLM)的进步,AI 编程助手的开发已经取得了显著的进展,这些助手能够生成、修改和理解软件代码。然而,目前的评估方法仍然存在诸多局限,许多基准测试往往仅集中在 Python 等单一语言,无法全面反映真实代码库的结构和语义多样性。SWE-P

消息称苹果持续推进智能眼镜项目:融入 AI 技术,有望 2027 年推出

IT之家 4 月 27 日消息,马克・古尔曼(Mark Gurman)在最新一期《Power On》中报道,苹果公司仍在持续推进其智能眼镜项目。这款产品目前的代号为“N50”,将融入苹果公司的人工智能技术,且有望以较为亲民的价格推向市场。苹果的最终目标是开发出行业领先的增强现实眼镜,但目前来看,距离将其作为一款消费级产品推向市场仍需数年时间。在此期间,苹果计划推出一款类似于 Meta 与雷朋合作

哥伦比亚大学两位退学生打造“AI 面试作弊神器”,拿下 500 万美元融资

IT之家 4 月 22 日消息,据外媒 TechCrunch 报道,当地时间上周日,年仅 21 岁的 Chungin “Roy” Lee 宣布,其初创企业 Cluely 完成 530 万美元(IT之家注:现汇率约合 3867.4 万元人民币)种子轮融资,投资方包括 Abstract Ventures 和 Susa Ventures。这家位于旧金山的公司主打一款 AI 工具,号称可让用户“在所有场

智谱Z基金出资3亿支持全球开源社区 北京追加投资2亿元

北京市人工智能产业投资基金宣布在去年已有投资基础上,继续追加投资智谱(Z.ai)2亿元人民币,支持智谱的开源模型研发与开源社区生态建设。智谱是基金成立以来投资的第一家 AI 大模型企业,也是目前成长最快的企业。智谱在包括文本、推理、语音、图像、视频、代码等在内的模型能力上有全面积累,商业化布局完善,拥有超过百万规模的开发者社区和企业用户。此次追加投资旨在进一步推动智谱在开源模型和算法创新方面的能力

初探谷歌 Gemini 视频解析功能,AI 准确识别视频拍摄场所

IT之家 4 月 22 日消息,科技媒体 Android Authority 今天(4 月 22 日)发布博文,报道称谷歌 Gemini 聊天机器人被发现新增视频分析功能。用户可上传视频并提出相关问题,Gemini 能够基于视频内容进行精准分析。该团队拆解了安卓版 Gemini 最新版(16.15.38.sa.arm64 beta)APK 文件,成功激活了视频上传与分析功能。用户可以上传视频并输

Higgsfield AI 发布全新视频模型:电影级相机控制重塑创意边界

近日,Higgsfield AI 发布了其全新的生成式视频模型,引发了广泛关注。这一创新模型以其卓越的专业级相机控制、世界建模能力以及电影化的表现力脱颖而出,为AI视频生成领域注入了新的活力。Higgsfield AI 官方宣布,这一模型名为“DoP I2V-01-preview”,其设计灵感来源于对电影摄影艺术的深度理解,旨在为创作者提供前所未有的精准度和真实感。新模型最引人注目的特点之一是其预

高德发布 AI 导航智能体:高速驾车场景下可感知车道级交通流变化、事件事故

感谢IT之家网友 西窗旧事 的线索投递!IT之家 4 月 14 日消息,高德地图今日宣布推出基于地图的 AI 导航智能体(NaviAgent)。据技术负责人介绍,其核心架构采用 Planner-Executor 模式,通过感知、规划、执行、表达四大模块构建智能闭环,集成多项高德核心技术。官方表示,该智能体“更像经验丰富的‘老司机’”,能实时感知路况、预判风险并主动调整策略。据IT之家了解,以高

OpenAI 预告凌晨直播,满血版 o3 推理模型有望登场

感谢IT之家网友 GreatMOLA 的线索投递!IT之家 4 月 16 日消息,OpenAI 今日晚间 10 点发布预告,将在 o3 小时后进行直播。从官方特别用词来看,预计将发布满血版 o3 推理模型,时间为凌晨 1 点。OpenAI CEO 奥尔特曼本月初在社交平台 X 上发文称,可能在数周内发布 o3 和 o4-mini,未来几月内发布 GPT-5。o3 技术在 2024 年 12 月

Gemini 2.5 Pro (I/O 版) – 谷歌推出的升级版多模态AI模型

Gemini 2.5 Pro (I/O 版)是什么Gemini 2.5 Pro (I/O 版) 是 Google 推出的 Gemini 2.5 Pro 升级版多模态AI模型,具体版本号为 Gemini 2.5 Pro Preview 05-06。模型在编程能力上取得重大突破,擅长构建交互式 Web 应用、游戏和模拟程序。用户仅需提供提示词或手绘草图加功能描述,能快速生成功能完备的应用。Gemi

OpenAI免费开放轻量版Deep Research,o4-mini提供支持

OpenAI宣布,其强大的AI研究工具Deep Research将向免费用户开放轻量版,这一举措标志着AI技术普及化的又一重要进展。作为一款能够自主完成复杂研究任务的AI代理,Deep Research的免费开放将为学生、研究人员及广大用户提供更便捷的知识获取途径。Deep Research功能亮点:智能研究新体验Deep Research是OpenAI于2025年2月推出的一款AI研究代理,基于

Meta 发布 Llama 4 大模型:混合专家架构引领 AI 新时代

Meta 公司推出了其最新的开源人工智能模型 Llama4,标志着其在人工智能领域的又一重大进展。Llama4分为两个版本,分别命名为 Scout 和 Maverick,旨在提升 AI 模型的功能与表现。Meta 表示,Llama4是一个多模态大模型,能够处理文本、图像、视频和音频等多种数据类型,并能在这些格式之间自由转换。值得一提的是,Llama4系列首次采用了 “混合专家”(MoE)架构,这一

微软发布 Phi-4 系列小语言 AI 推理模型,AIME 2025 跑分超满血版 Deepseek R1

IT之家 5 月 1 日消息,微软昨日(4 月 30 日)发布 Phi-4-reasoning 系列推理模型,通过监督微调 Phi-4,并利用 o3-mini 生成的高质量“可教导”提示数据集训练,专为复杂推理任务设计。IT之家援引博文介绍,微软本次共推出 Phi-4-reasoning、Phi-4-reasoning-plus 和 Phi-4-mini-reasoning 三款模型,官方称该系

老人头晕3天AI主动报警查出癌症 家属表示挺庆幸

3 月 20 日,浙江宁波传来一则医疗领域的新闻。 65 岁的丘先生(为保护隐私使用化名)因连续三天头晕不适,甚至影响到行走能力,前往宁波大学附属人民医院就诊。面对这一突发症状,丘先生及其家属均感到十分担忧。在医院内,丘先生接受了常规检查,其中包括了CT扫描。然而,初步的检查结果并未显示出任何异常,这让医生们一度陷入了困惑。就在此时,医院引入的AI辅助诊断系统突然发出报警,提示丘先生可能存在早

非付费广告:OpenAI ChatGPT Search 搜索上线网购功能,基于评价 AI 洞察产品优缺点

IT之家 4 月 29 日消息,OpenAI 公司今天(4 月 29 日)在 X 平台发布推文,宣布增强 ChatGPT Search 搜索体验,新增购物功能,首批覆盖时尚、美妆、家居用品和电子产品等类别。用户可以通过提问或搜索,获取符合需求的产品推荐。ChatGPT 不仅会展示产品图片、价格和描述,还会提供用户评价,并直接链接至零售商(如 Walmart)的购买页面。OpenAI 强调这些推荐

OpenAI发布34页智能体实践指南:从网络搜索到代码编写

2025年4月17日,OpenAI通过社交媒体宣布发布了一份34页的《智能体实践指南》,为开发者提供构建智能体应用的全面指导。此举标志着OpenAI在推动AI技术落地与标准化方面的又一重要进展。据推文内容,该指南详细介绍了如何利用OpenAI的Responses API构建智能体,涵盖网络搜索、文件搜索及计算机使用等功能。Responses API是对Chat Completions API的重大

OpenAI 的 GPT - 4.1 无安全报告,AI 安全透明度再遭质疑

IT之家 4 月 16 日消息,本周一,OpenAI 推出了新的 AI 模型 GPT-4.1 系列。该公司表示,该模型在某些测试中,尤其是编程基准测试方面,表现优于其现有的一些模型。然而,与 OpenAI 以往的模型发布不同,GPT-4.1 并未附带通常伴随模型发布而公布的安全报告(即系统卡)。截至周二上午,OpenAI 仍未发布 GPT-4.1 的安全报告,且似乎并无此计划。OpenAI 发言

封杀AI“照骗”,“淘宝们”终于不忍了

声明:本文来自于微信公众号 锌刻度,作者:孟会缘,授权站长之家转载发布。当淘宝率先启动对AI假图的大规模治理工作,消费者今后网购到手的商品质量会更好一点吗?不可否认,借用平台方的力量从源头阻截AI假图,确实是最快见效的一种方式。毕竟,随着AI技术的低门槛应用,这种低成本违规模式还在刺激劣质商品的野蛮生长。不良商家通过AI合成图片,可以快速生成“精美”商品图,甚至批量盗用原创设计,极大降低盗图、

微软 Security Copilot 立功,AI 揪出三大开源引导程序 20 个关键漏洞

IT之家 4 月 1 日消息,科技媒体 bleepingcomputer 昨日(3 月 31 日)发布博文,报道称微软公司借助 AI 工具 Security Copilot,在 GRUB2、U-Boot 和 Barebox 三大开源引导程序中,发现了 20 个此前未知的漏洞。IT之家注:GRUB2 是 Ubuntu 等 Linux 系统的默认引导程序。微软本次在 GRUB2 上发现了 11 个漏

​亚马逊 AI 视频模型 Nova Reel 升级:可生成长达两分钟的视频片段

亚马逊近日对其 AI 视频生成模型 Nova Reel 进行了升级,推出了 Nova Reel1.1版本。这个新版本不仅能够生成长达两分钟的视频片段,还可以制作多镜头视频,使得各个镜头之间的风格保持一致。Nova Reel 于2024年12月首次发布,是亚马逊在生成视频领域的重要尝试。据 AWS 开发倡导者 Elizabeth Fuentes 在一篇博文中透露,用户可以通过提供最长4,000个字符

新创公司Cheehoo推出AI动画工具,助力艺术家与创作者

近日,一家名为 Cheehoo 的新兴科技娱乐公司在 beta 版中正式上线,旨在利用人工智能技术革新动画制作。该公司的创始团队由多位行业内知名人士组成,包括前梦工厂动画总裁 Chris deFaria、前苹果科学家及 AI / 机器学习专家 Dr. Hubert Tsai 和 Dr. Wei-Cheng Kuo,以及 Rideback 的联合首席执行官 Michael LoFaso 和 Jona