关闭广告

Claude Opus 4.5来了!单次生成打造《我的世界》,还破解高难度Agent测评

智东西3280人阅读

智东西
作者 陈骏达
编辑 李水青

智东西11月25日报道,今天,Anthropic发布了自家的旗舰编程模型Claude Opus 4.5。Anthropic称,这是全球范围内在编程、agents和计算机使用方面最强大的模型。

在真实世界软件工程测试SWE-bench Verified中,Claude Opus 4.5成为首款得分超过80%的AI模型,不仅领先于自家的Claude Sonnet 4.5,还超过了上周发布的Gemini 3 Pro和GPT-5.1 Codex-Max。


Anthropic还把该公司面试人类工程师的高难度居

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

新华保险首个中资产康养旅居社区落地开启旅居养老新范式

经理人杂志 浏览 3551

马斯克:特斯拉Optimus机器人将成为“令人难以置信的外科医生”

IT之家 浏览 3578

迪丽热巴的脸,又被审判了

科学发掘 浏览 213

美媒:乌克兰向美国提交对最新“和平计划”的回复

澎湃新闻 浏览 2964

比亚迪10月销售441706辆 新能源累计销售超1420万辆

网易汽车 浏览 3458

米兰冬奥中国体育代表团领奖装备亮相,藏着李宁的奥运“双胜”叙事

时代周报 浏览 3761

2026款途昂Pro限时一口价25.99万,全境安全大7座SUV新标杆

车之天下 浏览 1080

集微咨询发布《2025中国半导体后道设备行业上市公司研究报告》;

爱集微 浏览 2803

媒体:中东欧三国欲组队 在欧盟内部对援乌政策"掀桌"

上观新闻 浏览 10018

51岁的何炅自曝非常痛苦,如今谁都救不了他?

小梊搞笑解说 浏览 3742

拥抱变局!2025外滩年会揭幕,聚焦新秩序、新科技

国际金融报 浏览 3714

聚焦精准营养!英氏控股以科研创新引领婴幼儿辅食产业升级

时代周报 浏览 2933

中国AIGC用户破5亿,增长1倍;美团:今年超7成外卖低于15元;新能源事故,「破窗锤」被网友买爆

极客公园 浏览 3636

浙大突破:经验学习提升AI智能体现实世界物理认知

科技行者 浏览 2478

晶圆代工涨价,半导体持续高景气!| 0316

虎嗅APP 浏览 1663

给她的宇宙,Matthieu Blazy重塑香奈儿女性

时尚COSMO 浏览 3087

多项指标将破纪录,各方期待消费热潮,中国迎接“超级黄金周”

环球网资讯 浏览 4318

粉丝给艺人当辩护律师,还住一起了,这也行?

伊周潮流 浏览 2343

张柏芝又飞澳洲陪Lucas读书,独自拿八九件行李

八斗小先生 浏览 2471

车企不敢!专家:希望推出伤亡率车型榜单,新能源车极端事故不多

小李车评李建红 浏览 3235

隐退4年后,张一鸣久违现身!互联网大佬正集体杀回

深蓝财经 浏览 3815
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1