近日,AWS AI Labs 推出了 SWE-PolyBench,这是一个多语言的开源基准,旨在为 AI 编程助手的评估提供一个更全面的框架。随着大规模语言模型(LLM)的进步,AI 编程助手的开发已经取得了显著的进展,这些助手能够生成、修改和理解软件代码。然而,目前的评估方法仍然存在诸多局限,许多基准测试往往仅集中在 Python 等单一语言,无法全面反映真实代码库的结构和语义多样性。SWE-P
近日,谷歌发布了一份试点报告,指出如果员工在处理行政任务时使用人工智能(AI),每年可以节省超过122小时的工作时间。根据这份报告,若企业能够为员工提供几小时的基础培训,不仅可以迅速提升员工对技术的掌握程度,还有可能促进整体经济增长。报告中的分析显示,借助 AI 的潜力,英国的经济增长有望增加多达4000亿英镑,约合3.88万亿元人民币。图源备注:图片由AI生成,图片授权服务商Midjourney