关闭广告

Claude Opus 4.5来了!单次生成打造《我的世界》,还破解高难度Agent测评

智东西2266人阅读

智东西
作者 陈骏达
编辑 李水青

智东西11月25日报道,今天,Anthropic发布了自家的旗舰编程模型Claude Opus 4.5。Anthropic称,这是全球范围内在编程、agents和计算机使用方面最强大的模型。

在真实世界软件工程测试SWE-bench Verified中,Claude Opus 4.5成为首款得分超过80%的AI模型,不仅领先于自家的Claude Sonnet 4.5,还超过了上周发布的Gemini 3 Pro和GPT-5.1 Codex-Max。


Anthropic还把该公司面试人类工程师的高难度居

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

“青云租”爆雷员工揭内幕:每个员工每月需投资30台手机,11万台集中流向两个村庄

封面新闻 浏览 2459

这些韩系穿搭最适合普通人!多穿深色、衣服基础,简洁耐看

静儿时尚达人 浏览 1491

清华等联合开发"甜蜜点学习"算法:AI智能体训练效率提升2.5倍

科技行者 浏览 1420

Dockcase Selfix背屏保护壳亮相,适配iPhone 17 Pro系列

IT之家 浏览 2029

87岁画家范曾有四段婚姻 亲生后代一女一子

红星新闻 浏览 19522

利空突袭!凌晨,全线大跌!

券商中国 浏览 2017

足球报:J联赛改为跨年赛制,将对降雪地区俱乐部补贴50亿

懂球帝 浏览 2703

路易斯:感到很失望,明年我不知道还会不会在这里

懂球帝 浏览 2591

宁德时代再出手!1月内从弃控到增资,深度绑定富临精工磷酸铁锂版图

时代周报 浏览 1430

换装高功率电机,蔚来 firefly 萤火虫新车申报

IT之家 浏览 2419

特朗普突然宣布对韩关税升至25% 青瓦台紧急派人赴美

红星新闻 浏览 5366

绿军逆转险胜魔术双方6人20+对攻 布朗27分班凯罗28+6

醉卧浮生 浏览 2425

谁的自动驾驶算法更厉害?这场比赛在京沪同步开赛,定义未来出行安全边界

文汇报 浏览 1979

陈天桥亲自下场押注脑机接口赛道,中国首家超声波BCI企业格式塔成立

华夏时报 浏览 1788

真情侣就是好嗑,短剧界有多少“因戏生情”的cp?

仙女事件簿 浏览 2634

德国财长访问中国备受关注 德媒:此行意义重大

环球时报国际 浏览 44352

TA:利物浦的状态有所回暖;热刺展现了足够的斗志和韧性

懂球帝 浏览 2004

吉文:可能我有点老派,看不惯加纳乔走路歪着身子还挂条链子

懂球帝 浏览 2167

以军频袭黎巴嫩南部 黎总统斥责

新华社 浏览 2588

评论丨网购衣服上的“密码锁”,是商业诚信的刺眼“疤痕”

红星新闻 浏览 2580

或告别燃油时代 丰田Supra将于明年停产

车质网 浏览 2586
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1