关闭广告

Claude Opus 4.5来了!单次生成打造《我的世界》,还破解高难度Agent测评

智东西3272人阅读

智东西
作者 陈骏达
编辑 李水青

智东西11月25日报道,今天,Anthropic发布了自家的旗舰编程模型Claude Opus 4.5。Anthropic称,这是全球范围内在编程、agents和计算机使用方面最强大的模型。

在真实世界软件工程测试SWE-bench Verified中,Claude Opus 4.5成为首款得分超过80%的AI模型,不仅领先于自家的Claude Sonnet 4.5,还超过了上周发布的Gemini 3 Pro和GPT-5.1 Codex-Max。


Anthropic还把该公司面试人类工程师的高难度居

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

iCAR苏峻:我们不做夹生饭,不造速生车

网易汽车 浏览 3146

赵建:货币苏醒

首席经济学家论坛 浏览 3654

当“中国表格之王”开始发力多维表格

硅星人 浏览 3545

牛弹琴:委内瑞拉面临三场较量 美国将更加狂妄

北京日报客户端 浏览 6247

金价暴跌 不少上海人跑外地买黄金:就像在抢大白菜

极目新闻 浏览 6678

荣耀手机应用商店正式上线金标专区

IT之家 浏览 2549

马斯克宣布X Money四月公测

财闻 浏览 1758

夸克AI眼镜开售,88VIP叠加9折消费券,最低3329元

海外网 浏览 3771

边打字边出片,交互式生成长视频!英伟达联合MIT开源新SOTA

新智元 浏览 3752

10月第一周豪华SUV销量榜 奥迪Q5L第2/宝马X3第5

小李子体育 浏览 3400

牛弹琴:伊朗和美以停火又悬了 有三点实在太诡异

现代快报 浏览 1059

列阵“泰山” 岚图汽车迈入30万辆时代

网易汽车 浏览 3351

马克龙不加入和平委员会 特朗普:加征关税他就会加入

界面新闻 浏览 11955

美军称在东太平洋打击一“贩毒船” 致4人死亡

极目新闻 浏览 3027

云南外援奥斯卡连续七场联赛参与进球,刷新个人中超最长纪录

懂球帝 浏览 3593

E句话|姚晨曹郁官宣离婚

仙女事件簿 浏览 1595

内存条现货价格“跳水”三成,手机厂商却在涨价,存储市场为何两极分化?

红星资本局 浏览 1047

缺席训练!曝25岁主力门将遭申花“三停”,上轮中超赛后通宵泡吧

我爱英超 浏览 3679

是否以入选英格兰队为目标?勒温:努力训练,顺其自然

懂球帝 浏览 2942

AI概念股重挫,纳指跌近1%,英伟达跌1.63%,软银狂泻12%,国际油价连续七天走高

第一财经资讯 浏览 462

小马、文远回港上市 但自动驾驶还没赢家

虎嗅APP 浏览 3508
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1