阿里通义千问推出视觉推理模型 QVQ-Max:可分析、推理图片和视频内容

感谢IT之家网友 泓澄、咩咩洋 的线索投递!IT之家 3 月 28 日消息,今天凌晨,阿里通义千问团队宣布推出新一代视觉推理模型 QVQ-Max。据官方介绍,QVQ-Max 不仅能够理解图片和视频内容,还能为上述信息提供分析并推理。不止分析和推理,QVQ-Max 还可以完成设计插图、生成短视频剧本等内容,甚至根据用户的需求创建角色扮演内容。核心能力:从观察到推理QVQ-Max 的能力可以总结为

小米米家隐藏式智能窗帘发布:五种控制方式,599 元

感谢IT之家网友 風見暉一、Autumn_Dream 的线索投递!IT之家 3 月 24 日消息,小米智能生态今日推出一款米家隐藏式智能窗帘,新品首发价 599 元,将于 3 月 25 日 10 点开售。IT之家从官方海报获悉,这款新品仅有“半掌大小”,配备强劲性能电机,支持五种控制方式:语音、手机远程、自动定时、遥控器以及手拉。此外,该产品还具有丰富的智能功能设置,支持三挡调速、手拉控速、单

中国首个高速动车组空气动力学智能化仿真大模型问世

IT之家 3 月 27 日消息,据中国中车今日消息,2025 年 3 月,中国高速动车组空气动力学智能化仿真大模型在青岛成功问世,推动高速列车气动仿真计算从“天级”提升至“秒级”,标志着中国高速列车研发迈入人工智能新阶段。该大模型是在中国中车统一组织下,由国家高速列车青岛技术创新中心联合中车青岛四方机车车辆股份有限公司,基于中车斫轮大模型开发而成的。在高速列车领域,空气动力学效应是整车设计的关键

GL.iNet 推出 Slate 7 便携式无线路由器:BE3600 规格,Type-C PD 供电

感谢IT之家网友 华南吴彦祖 的线索投递!IT之家 3 月 28 日消息,GL.iNet 广联智通昨日正式对外推出了 Wi-Fi 7 便携式无线路由器产品 Slate 7(IT之家注:型号 GL-BE3600)。这款路由器拥有 BE3600 的无线规格,采用 Type-C PD 而非传统的 DC 供电,相对小巧的身形适合出行携带。Slate 7 基于高通四核 1.1GHz 处理器,配备 1GB

全球“机器人竞赛”进入白热化,美企敦促政府设立联邦机构扶持行业

IT之家 3 月 27 日消息,据《财富》杂志今日报道,美国机器人企业正呼吁制定国家级机器人发展战略,包括设立专门的联邦机构,以推动行业发展。特斯拉、波士顿动力和 Agility Robotics 等公司代表周三在国会山向议员展示了各自的机器人产品,并敦促政府出台政策,助力美国企业在全球新一代机器人竞赛中保持领先。人形机器人初创公司 Apptronik 联合创始人兼首席执行官杰夫・卡德纳斯指出,

外国高三学生创建 AI 评测网站:让模型在《我的世界》里“一决高下”

IT之家 3 月 22 日消息,由于传统 AI 基准测试方法难以全面评估模型能力,AI 开发者正尝试更具创意的测试方式,其中一种测试手段,则是微软沙盒建造游戏《我的世界》。据外媒 TechCrunch 报道,名为阿迪・辛格(Adi Singh)的高三学生创建了专门为 AI 评测而开发的网站 Minecraft Benchmark(简称 MC-Bench),让 AI 模型在《我的世界》中同台竞技,

OpenAI 审查策略大转向!ChatGPT 新图像生成器爆红,争议内容限制放宽引关注

OpenAI 审查策略大转向!ChatGPT 新图像生成器爆红,争议内容限制放宽引关注本周,OpenAI 在 ChatGPT 中推出全新图像生成器,其生成吉卜力风格图像的能力迅速走红。该生成器基于 GPT-4o,显著提升了 ChatGPT 的图片编辑、文本渲染和空间表示功能。然而,更引人注目的是 OpenAI 对内容审核政策的重大调整。新政策允许 ChatGPT 根据用户要求生成描绘公众人物、仇恨

阿里开源最新多模态模型 Qwen2.5-VL-32B:主打视觉语言,数学推理也很强

就在 DeepSeek-V3 更新的同一夜,阿里通义千问 Qwen 又双叒叕一次梦幻联动了 —— 发布 Qwen2.5-VL-32B-Instruct。此前开源家族视觉语言模型 Qwen2.5-VL 包括 3B、7B 和 72B 三种尺寸。这一次的 32B 版本进一步兼顾尺寸和性能,可在本地运行。同时经过强化学习优化,在三个方面改进显著:回答更符合人类偏好;拥有更强的数学推理能力;在图像解析、内

报道称阿里云启动近年来最大规模 AI 人才校园招聘

据科创板日报报道,阿里云在全球范围内开展项大规模的 AI 人才校园招聘活动。这次招聘规模被认为是近年来最大的一次,主要面向全球顶尖高校,如清华大学、北京大学、浙江大学、麻省理工学院和斯坦福大学等,旨在寻找在人工智能领域具备潜力的人才。此次招聘涵盖了多个技术领域,包括大语言模型、多模态理解与生成、模型应用以及 AI 基础设施等。为了吸引优秀人才,阿里云特别设立了 “A Star 项目” 和 “AI

诺奖得主罗杰・彭罗斯:人工智能不会有意识,因此不应被视为“智能”

IT之家 3 月 26 日消息,随着生成式 AI 重塑人类对世界和工作的认知,关于 AI 是否会取代人类也一直是个备受瞩目的议题,不少人更预测 AI 未来会“具备意识”。据外媒 Windows Central 今日报道,诺贝尔奖得主、理论物理学家罗杰・彭罗斯爵士(Sir Roger Penrose)对此持不同看法。他指出,AI 无法拥有意识,这一观点基于哥德尔不完备定理(Gödel"s Inco

快转字幕:语音转文字平台,为用户提供AI自动生成字幕,一键语音转文字服务

快转字幕是语音转文字平台,为用户提供高准确率的语音转字幕服务。通过自动语音转字幕功能,用户可以为无字幕的视频高效添加字幕,节省手动修改时间,从而提高自媒体工作者的效率。经过深度训练的 AI 模型保证了我们的准确率位居行业之巅,支持超过99种语言和方言识别转录,即使是不清晰的语音对话也能准确识别。此外,我们还提供强大的AI自动翻译功能,可帮助用户为海外营销视频或优质视频添加所需的语言翻译字幕。

寻光:AI视频创作平台,用PPT制作的方式创作视频,为用户带来一站式、高可控的AIGC创作体验

寻光AI视频创作平台是达摩院推出的一款创新产品,以视觉AIGC为核心功能,让用户通过PPT制作的方式轻松创作视频。该平台提供一站式、高可控的AIGC创作体验,让用户体验到AI创作的魅力。寻光功能视觉AIGC功能:利用先进的人工智能技术,实现视频内容的自动生成和编辑。PPT制作:用户可以通过简单的PPT操作,快速制作出高质量的视频内容。高可控性:用户可以自定义视频风格、字幕、音效等,实

超级Agent如何让AI更“有用”?

声明:本文来自于微信公众号 三言Pro,作者:三言Pro,授权站长之家转载发布。AI助手的最终形态到底是什么样的?从ChatGPT开启的AI聊天机器人,到接入联网能力,再到各种多模态能力的加入。AI助手的能力在以肉眼可见的速度快速迭代。DeepSeek的加入,又让推理成为一种进化潮流。在深度体验过了大多数对话式AI助手后,几乎颠覆了我之前的搜索习惯。最近又体验了阿里夸克刚推出“AI超级框”,给

告别低质信息图!清华、微软联手打造BizGen,一键生成专业级幻灯片和海报,让你的内容瞬间高大上!

还在为制作信息图和幻灯片绞尽脑汁,对着屏幕抓耳挠腮吗?还在被那些文字模糊、排版混乱的“高科技”生成工具气得想摔电脑吗?别担心,你的救星来了!清华大学、微软研究院等顶尖机构联手推出了一款名为BizGen的秘密武器,它就像一位技艺高超的设计大师,能够根据你提供的文章内容,瞬间变幻出专业水准的信息图和幻灯片,让你的工作效率直接起飞!你可能会疑惑,市面上不是已经有很多文本转图像的工具了吗?没错,但它们大多

Perplexity 与 Seattle 初创企业 Firmly 联手提升AI搜索应用的电商功能

Perplexity,近年来备受关注的 AI 搜索应用,近日宣布与位于西雅图的初创公司 Firmly 达成合作,旨在为用户提供更丰富的电商体验。这一合作将使得企业能够在 Perplexity 平台内直接销售产品,进一步增强用户的购物便利性。Firmly 是一家成立五年的初创公司,由三位前三星高管共同创立。该公司专注于帮助企业在各种数字渠道内实现电子商务交易,包括内容、消息应用、数字广告和直播等。F

Basic Memory:让 LLM 对话知识持久留存,构建本地知识库新利器

Basic Memory是Basic Machines推出的知识管理系统,借助与Claude等LLM自然对话构建持久知识,并存储于本地Markdown文件,通过MCP协议实现LLM对本地知识库的读写。多数LLM互动短暂,缺乏背景知识,现有解决方法有局限。Basic Memory则优势显著:知识本地存储,由用户掌控;支持用户与LLM双向读写同一文件;采用Markdown和语义模式,结构清晰简单;形成

那个利用 AI 通过亚马逊、Meta面试的大学生,被学校开除了!

在此之前,罗伊・李(Roy Lee)开发了一款利用AI帮助自己通过亚马逊、Meta等公司技术面试的工具,他说,他现在被哥伦比亚大学停学了!站长之家(ChinaZ.com) 3月28日 消息:哥伦比亚大学的学生罗伊・李(Roy Lee)称,他在开发了一款AI工具后被学校停学了 —— 这款工具曾帮助他通过了 Meta(原 Facebook)、亚马逊(Amazon)和 TikTok 严苛的技术面试(

Cloudflare 推出 “AI 迷宫”,引导恶意爬虫走入虚假数据陷阱

全球知名的网络基础设施公司 Cloudflare 近日宣布推出一项名为 “AI Labyrinth”(AI 迷宫)的新工具,旨在打击未经授权抓取网站数据的网络爬虫。这一举措的核心在于,当 Cloudflare 监测到不当的爬虫行为时,该工具会将这些爬虫引导到一系列 AI 生成的虚假页面,目的在于 “拖延、迷惑并浪费” 恶意爬虫的资源。长期以来,网站管理员依赖 “robots.txt” 文件来管理爬

vivo 回应成立机器人 LAB:正常业务调整,后续有更多信息披露

IT之家 3 月 24 日消息,近日有消息称,vivo 已成立机器人 LAB(实验室),这个独立中心将专注于机器人相关产品的孵化与研究,将聚焦家庭机器人。今日,《每日经济新闻》记者联系 vivo 方面了解情况,对方回应称:“正常业务调整,机器人业务后续在博鳌亚洲论坛上会有更多信息披露。”IT之家注意到,2023 年 12 月,vivo 执行副总裁、首席运营官胡柏山曾表示“人形机器人也是 vivo

AMD 推出开源项目“GAIA”实现本地大模型高效运行:针对锐龙 AI 300 系列处理器优化,目前仅适用于 Windows

IT之家 3 月 22 日消息,当地时间周四,AMD 宣布推出专为本地运行大语言模型(LLM)设计的应用 GAIA(发音为/ˈɡaɪ.ə/)并在 Github 开源,目前仅限于 Windows 平台。GAIA 是一款生成式 AI 应用,能够在 Windows PC 上实现本地化私密运行 LLM,并针对锐龙 AI 300 系列处理器进行了优化,标志着 AMD 在边缘计算领域的又一重要布局。在 NP