上海人工智能实验室开源小语种多模态数据集万卷·丝路2.0

由上海人工智能实验室发布的“万卷·丝路2.0”多语言多模态语料库正式开源。该语料库在原有的阿拉伯语、俄语、韩语、越南语、泰语等5个语种基础上,新增了塞尔维亚语、匈牙利语、捷克语3个稀缺语料数据,涵盖文本、图片、音频、视频四大模态,数据总量超过1150万条,音视频时长超过2.6万小时,成为小语种多模态领域的重要资源。“万卷·丝路2.0”具有多语言、大规模、多模态、高质量的特点。它不仅扩充了语种数量,

月之暗面Kimi开源数学定理证明模型Kimina-Prover

 Kimi 技术团队近日发布了 Kimina-Prover 预览版的技术报告,并开源了1.5B 和7B 参数的模型蒸馏版本、用于数据生成的 Kimina-Autoformalizer-7B 模型以及修订过的 miniF2F 基准测试数据集。Kimina-Prover 是由 Numina 和 Kimi 团队联合研发的一款数学定理证明模型,它在形式化定理证明领域采用了一种新颖的、由推理驱动的探索范式,

OpenAI发布两款多模态推理模型o4-mini、满血版o3

在今天凌晨1点的技术直播中,OpenAI正式推出其最新且最强大的多模态模型o4-mini和满血版o3。这两款模型具备独特优势,不仅能同时处理文本、图像和音频,还可作为智能体自动调用网络搜索、图像生成、代码解析等工具,并且拥有深度思考模式,能在思维链中思考图像。OpenAI公布的测试数据显示,o4-mini表现卓越。在AIME2024和2025测试中,其准确率分别达到93.4%和92.7%,甚至超越

OpenAI 推出全新推理模型 o3,实现图像思考能力

OpenAI 近期发布了其最新的推理模型 o3和 o4-mini,标志着人工智能领域的一次重大突破。这两款模型不仅在推理能力上超越了以往的版本,还首次实现了图像思考的能力,能够将视觉信息直接融入到思维过程中。o3被誉为 “天才级” 模型,尤其在编程和数学等任务中表现出色,准确率高达87.5%。这次发布的 o3和 o4-mini 模型在多模态处理上表现出色,具备了图像处理、网页搜索和代码执行等功能。

谷歌 Gemini Live 功能全面开放,安卓用户迎来新体验

近日,谷歌宣布其 Gemini 应用中的 Gemini Live 功能将免费向所有安卓用户开放。这一功能最早于本月早些时候仅限于 Pixel9和三星 Galaxy S25用户,通过 Gemini Advanced 订阅才能使用。然而,随着用户对 Gemini Live 功能的积极反馈,谷歌决定改变策略,推动这一功能的普及。Gemini Live 功能的强大之处在于它能够实时识别用户手机摄像头和屏幕

Adobe 投资英国AI视频公司 Synthesia

近日,英国初创公司 Synthesia 凭借在企业 AI 生成视频领域的杰出表现,成功获得了 Adobe 的战略投资。自成立以来,Synthesia 在 AI 视频化身技术上不断创新,目前已成为行业的领军者。据悉,Synthesia 的年度经常性收入已突破1亿美元,成为众多企业视频解决方案的首选。目前,全球已有超过6万家公司使用 Synthesia 的服务,其中70% 以上是财富100强企业。每天

谷歌利用 AI 技术去年封停 3920 万广告账号,效果显著

谷歌近期宣布,2022年该公司成功封停了3920万个广告主账号,数量是2023年的三倍。这一成绩主要归功于谷歌在广告审核中应用的先进人工智能技术。通过大语言模型的辅助,谷歌能够在广告投放前识别出商业冒充、非法支付信息等违规行为,从而快速暂停大部分广告账户。谷歌广告安全总经理亚历克斯・罗德里格兹在一次虚拟媒体会议上指出,这些 AI 模型在改进广告安全方面发挥了重要作用,尽管如此,整个过程仍有人工审核

​JetBrains 推出编码智能体 Junie AI,助力编程与调试全新体验

日前,JetBrains 公司正式宣布其全新的编码智能体 ——Junie AI,已达到 “生产就绪”(production-ready)的状态。这意味着,开发者们可以利用 Junie AI 更高效地处理编写代码和调试运行等复杂任务。Junie AI 的推出,标志着 JetBrains 在 AI 工具领域的又一重大进展。除了 Junie AI,JetBrains 还对其旧版 AI 助手进行了更新,支

​微信首个AI助手 “元宝” 正式上线,可以添加为微信好友

微信平台推出了首个 AI 助手 ——“元宝”。用户只需在微信中搜索 “元宝”,添加为好友后,即可轻松与其进行对话。与传统的聊天机器人不同,元宝以好友的身份出现,无需下载其他应用或小程序,聊天时甚至会显示 “对方正在输入...” 的信息,带来更加真实的互动体验。元宝 AI 是腾讯最新开发的 AI 助手,搭载了混元和 DeepSeek 双模引擎,能够无缝接入微信生态。其强大的功能包括快速解析微信公众号

Brave Search MCP Server:强大本地搜索,让信息获取更简单!

在这个信息爆炸的时代,寻找所需的内容常常像大海捞针一样困难。为了帮助用户更高效地获取信息,Brave Search MCP 服务器应运而生!这款产品结合了强大的搜索能力与灵活的本地服务,让用户能够轻松访问网页信息及附近的商家、餐馆等服务。它不仅让搜索变得更智能、更方便,还让用户体验到前所未有的精准度。Brave Search MCP 服务器的魅力不仅在于它的强大功能,还在于其出色的用户体验设计。用

微信上线元宝AI好友功能,强化超级应用生态对竞争对手形成新挑战

微信于2025年4月16日正式推出元宝AI好友功能,允许用户将腾讯自研的AI助手元宝添加为微信联系人,直接在聊天窗口进行交互。这一功能的发布不仅增强了微信作为超级应用的粘性,也对其他AI聊天服务和小程序构成显著竞争压力。以下是AIbase对元宝AI好友功能的深度解析,探讨其技术亮点、用户体验及对行业的潜在影响。元宝AI好友上线:无缝融入微信生态元宝是腾讯基于其混元(Hunyuan)大语言模型开发的

DroidRun正式开源,LLM驱动Android手机自动化控制新突破

近日,一个名为DroidRun的开源项目引发了广泛关注。该项目通过大型语言模型(LLM)实现自然语言指令控制Android手机,为用户提供了前所未有的自动化体验。从社交媒体管理到日常任务自动化,DroidRun展示了AI在移动设备交互领域的巨大潜力。据AIbase了解,DroidRun已正式开源,源代码现已推送至GitHub,为开发者与技术爱好者提供了自由探索与二次开发的机会。功能亮点:自然语言驱

英国或将吸引OpenAI与软银5000亿美元"星门"AI数据中心巨额投资

在人工智能技术迅猛发展的浪潮中,一场关乎未来AI基础设施布局的重大战略部署正悄然展开。据知情人士最新透露,英国已跃升为OpenAI与软银共同打造的海外AI基础设施新项目的首选目的地之一,这一消息引发了全球科技界的高度关注。这个被命名为"星门"(Stargate)的庞大数据中心计划总投资高达5000亿美元,堪称AI基础设施史上的巨型工程。尽管项目初期将全部落户美国本土,但随着国际扩张战略的逐步推进,

腾讯增持智元机器人

企查查APP显示,近日,智元机器人关联公司上海智元新创技术有限公司发生工商变更,广西腾讯创业投资有限公司持股比例由约2.06%增加至约2.7%。企查查信息显示,该公司成立于2023年,法定代表人为邓泰华,现由桑蓬(上海)科技合伙企业(有限合伙)等共同持股。

国际仲裁机构发布人工智能应用新指南

近日,国际仲裁领域的重要机构 —— 国际仲裁学会(Ciarb)发布了一份关于人工智能(AI)在仲裁中应用的指南。这一举措旨在为法律专业人士和仲裁员提供关于如何在仲裁过程中道德地使用这一新兴技术的实用建议。随着科技的迅速发展,人工智能正逐渐渗透到各个行业,包括法律和仲裁领域。AI 可以在文档审查、证据分析及裁决建议等方面发挥重要作用,但其应用也伴随着一系列伦理和法律挑战。Ciarb 的这份新指南希望

SoundHound AI(SOUN)获得重要 AIOps 认可,但股价目标被下调

最近,SoundHound AI, Inc.(NASDAQ:SOUN)在人工智能领域获得了显著认可,特别是在 AIOps(人工智能运维)方面的表现。然而,尽管在技术上取得了一定的成就,市场对其未来的预期却出现了下调。这一消息引发了投资者的广泛关注。在当前的市场环境中,人工智能技术的应用愈发重要,SoundHound AI 凭借其创新的语音识别和自然语言处理技术,正逐渐在行业中崭露头角。该公司不仅在

阿里巴巴AI模型DAMO PANDA获FDA认定为“突破性医疗器械”,攻克胰腺癌早期筛查难题

,阿里巴巴AI模型DAMO PANDA正式获得美国食品药品监督管理局(FDA)认定为“突破性医疗器械”。这一认证标志着阿里巴巴在人工智能医疗领域的突破性进展,也是中国头部科技企业首次获得这一权威认可。图源备注:图片由AI生成,图片授权服务商MidjourneyDAMO PANDA是由阿里巴巴达摩院研发的胰腺癌筛查AI模型,旨在通过精准分析CT影像中的细微病灶,实现早期胰腺癌的筛查。胰腺癌因早期症状

DeepSeek创始人梁文锋荣登《时代》“2025年全球最具影响力100人”榜单

近日,DeepSeek创始人梁文锋入选《时代》杂志“2025年全球最具影响力100人”榜单,成为全球科技与金融领域的领军人物之一。与此同时,梁文锋还凭借330亿元人民币的财富首次登上了2025年3月27日发布的《胡润全球富豪榜》,进一步巩固了他在全球商业界的影响力。梁文锋的成功之路始于2008年,当时他开始带领团队利用机器学习等前沿技术,探索全自动量化交易。这一战略性的技术创新奠定了他在量化交易行

火山引擎发布豆包1.5深度思考模型:结合视觉理解与智能项目管理

在近日举行的火山引擎FORCE LINK AI创新巡展上,火山引擎总裁谭待正式公布了豆包1.5深度思考模型,标志着这一创新技术将正式面向企业提供服务。豆包1.5不仅在基础功能上进行了升级,还引入了更多智能化的应用场景,助力企业实现更高效的数字化转型。谭待在发布会上表示,豆包1.5深度思考模型能够结合视觉理解,提供更多创新功能。例如,该模型能够根据用户上传的照片进行地貌分析,帮助旅行者在外出时更方便

​Gartner报告显示:2027年,任务特定AI将超越通用AI

近日,Gartner 发布了一份新报告,指出到2027年,企业将使用任务特定的人工智能模型的频率是通用大型语言模型的三倍。报告中提到,虽然通用的语言模型在语言处理方面具有强大的能力,但在需要深入理解特定业务领域的任务中,它们的响应准确性却会下降。因此,越来越多的企业开始关注定制化的 AI 模型,以满足其特定需求。图源备注:图片由AI生成,图片授权服务商MidjourneyGartner 的副总裁兼