GigaTok – 港大联合字节推出用于自回归图像生成的视觉分词器

GigaTok是什么GigaTok 是用于自回归图像生成的视觉分词器,参数量达 30 亿。通过语义正则化技术,将分词器特征与预训练视觉编码器(如 DINOv2)的语义特征对齐,有效约束潜在空间复杂度,解决了视觉分词器在扩展时重建质量与生成质量之间的矛盾。GigaTok 采用了一维分词器架构以提高可扩展性,优先扩展解码器以高效分配计算资源,引入熵损失来稳定大规模模型的训练。GigaTok的主

微软MarkItDown MCP,可把Word、Excel等转换成markdown格式

在数字化时代,如何有效地处理文档信息已经成为了许多行业中的一个热门话题。而今,微软推出的 MarkItDown MCP(Model Context Protocol)将文档处理提升到了一个新的高度!想象一下,您只需简单几步,就能将各种格式的文件(如 PDF、Word、PowerPoint 等)轻松转换为 Markdown 格式,为您的文本分析和大型语言模型(LLM)应用提供无缝支持。更为惊艳的是,

OpenAI CEO批评礼貌语言浪费:与AI对话不需要“请”和“谢谢”

OpenAI的首席执行官萨姆·奥特曼(Sam Altman)近日提出了一个具有挑战性的观点,称与ChatGPT这样的聊天机器人使用礼貌语言,如“请”和“谢谢”,实际上是一种浪费,耗费了大量的电力和计算资源。奥特曼指出,尽管许多人认为与人工智能保持礼貌是一种文化上的必要行为,或者有助于提升交互质量,但这种做法却无形中增加了人工智能系统的负担。每次使用礼貌语言时,聊天机器人不仅要识别和处理这些词汇,还

阿联酋首创:人工智能助力法律制定速度提升 70%

阿联酋近期宣布将首次利用人工智能技术参与法律的撰写工作,旨在大幅提高法律制定的效率。据悉,这一创新举措预计能将法律草案的制定时间缩短多达70%。在阿联酋的法律框架内,政府希望借助 AI 的强大分析能力,快速生成符合现代社会需求的法律文本。图源备注:图片由AI生成,图片授权服务商Midjourney阿联酋官方表示,这项技术不仅将加快立法进程,还有助于提升法律的适应性。通过 AI 的实时数据分析,法律

Vifa 发布 Helsinki 2.0 便携音箱,内置 ChatGPT 智能助手

近日,丹麦音响制造商 Vifa 正式宣布,旗下首款搭载 ChatGPT AI 助手的智能音箱 Helsinki2.0已经完成预研,即将在海外市场推出。这款便携音箱的推出不仅提升了音响的智能化程度,更为用户提供了个性化的听觉体验。Helsinki2.0的设计旨在为用户创造一个更加智能和便捷的音乐环境。官方介绍称,该音箱具备记忆功能,能够根据用户的情绪、生活场景和音乐口味等因素,提供个性化的音乐、电影

Netflix推全新 AI 搜索功能,用户可通过自然语言搜索

Netflix 近日开始测试一项全新的 AI 搜索功能,这一功能基于 OpenAI 的技术,旨在提升用户在流媒体平台上的内容发现体验。用户将能够通过自然语言来搜索影片,不再局限于传统的按类型或演员进行搜索。据彭博社的报道,这项新功能能够理解用户更具体的需求,包括他们的观影心情。例如,用户可以直接表达想要观看 “轻松搞笑的电影” 或者 “适合晚上一个人看的恐怖片”,系统将根据这些描述推荐相应的内容。

医疗AI新星每因智能获千万融资,致力于精准疾病风险预测

近日,杭州的医疗 AI 公司每因智能科技有限公司宣布完成千万元级种子轮融资,资金将主要用于其核心产品的研发及商业化落地。此次融资由卓源亚洲等机构领投,西湖政府直投基金也进行了跟投。每因智能专注于运用人工智能技术来预测疾病风险,推动健康管理。其核心产品是基于自研的 DP-LLM 大模型,能够支持多模态医疗数据的处理,精准量化个体未来的疾病风险,涵盖数百种疾病及上万个风险因子。创始人兼 CEO 郭潇宇

Reachy2机器人发布:互动自然,售价 7万美元

Hugging Face 宣布通过收购法国初创公司 Pollen Robotics,正式推出开源人形机器人 Reachy2。这一消息在社交媒体和 AI 社区引发热烈讨论,被认为是人形机器人与生成式 AI 结合的重要里程碑。作为专为 AI 研究和教育设计的“实验室伙伴”,Reachy2以其开源特性、先进功能和人性化设计,迅速成为全球顶尖实验室的关注焦点。Reachy2:人形机器人的创新标杆Reach

OpenAI 4o图像生成支持自定义GPTs,个性化AI创作再升级

近日,OpenAI宣布其最新4o模型的图像生成功能将支持自定义GPTs,为用户提供更灵活的个性化AI创作体验。据AIbase了解,这一更新允许开发者与用户基于4o模型构建定制化的GPTs,生成符合特定需求的高质量图像内容。消息一经发布,便引发了AI社区的广泛讨论,标志着OpenAI在个性化AI工具领域的又一重要进展。相关技术细节已在OpenAI官方平台披露,预计很快将向用户全面开放。核心亮点:个性

美国多所社区大学遭“机器人学生”渗透:一切行动都为了助学金

IT之家 4 月 21 日消息,据外媒“Voice of San Diego”4 月 14 日报道,现如今线上教学已经蔚然成风,但一种被称为“机器人学生”的现象在美国社区大学日益普遍。这些“学生”并非真正为学习而来,而是为在领取助学金之前维持在籍身份而注册,且数量仍在持续增长。据多所社区大学的教职员工透露,在全面转向在线授课的体制下,出现了大量回复内容明显不合常理、几乎不可能是人类所写的账户。究