关闭广告

Claude Opus 4.5来了!单次生成打造《我的世界》,还破解高难度Agent测评

智东西399人阅读

智东西
作者 陈骏达
编辑 李水青

智东西11月25日报道,今天,Anthropic发布了自家的旗舰编程模型Claude Opus 4.5。Anthropic称,这是全球范围内在编程、agents和计算机使用方面最强大的模型。

在真实世界软件工程测试SWE-bench Verified中,Claude Opus 4.5成为首款得分超过80%的AI模型,不仅领先于自家的Claude Sonnet 4.5,还超过了上周发布的Gemini 3 Pro和GPT-5.1 Codex-Max。


Anthropic还把该公司面试人类工程师的高难度居

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

趁春光大好,赶紧法式一下!

瑞丽网 浏览 19471

续航突破1000公里!李斌实测蔚来150度电池包,却被喷上热搜?

爱范儿 浏览 12957

苏永康被曝出轨!劣迹太多网友呼吁封杀?

萌神木木 浏览 580

恭喜!徐冬冬与尹子维官宣订婚,戴百万钻戒大秀幸福,合照超甜

扒虾侃娱 浏览 12569

车企研发:小米车门锁在某些看不见的地方省去了成本

第一财经 浏览 5139

记者问批评球员是否担心更衣室反对,穆帅:你爸对你永远都很好?

懂球帝 浏览 362

拉波尔塔:回到诺坎普,我流下了一些泪水

懂球帝 浏览 688

荷媒:德容在国家德比中受伤,他将退出本期荷兰队&伤缺两周

直播吧 浏览 19326

乌媒:乌军发布士兵做“不要出声”手势视频,称不宣布“反攻”时间

环球网资讯 浏览 16456

【IT之家开箱】口袋中的完全体哈苏:OPPO 哈苏专业影像套装图赏

IT之家 浏览 1034

长沙不雅视频女医生同款睡裙22万人买 幕后偷拍者披露

壹月情感 浏览 4971

佘智江获利达1.5亿元:曾逼美貌女性卖淫 或供"玩乐"

新京报 浏览 14671

牛弹琴:美国史无前例对华下黑手 一些条款确实磨刀霍霍

上观新闻 浏览 86041

闫妮姚晨合拍大片,梦回《武林外传》

蕾爸退休日记 浏览 725

议价空间变大 6月份北京二手房市场向买方“倾斜”

新京报 浏览 15477

拒增加议员津贴后 米莱被指给自己和内阁高官加薪48%

参考消息 浏览 70003

搭载雷神AI电混2.0技术 吉利银河星耀7申报信息发布

网易汽车 浏览 1024

拜登似是怕特朗普与中国“合作”?

浏览 22934

奇瑞集团10月份销售汽车281161辆 同比增长3.3%

网易汽车 浏览 759

印尼国脚小赖因德斯:这段旅程始于梦想,如今却以痛苦告终

懂球帝 浏览 1026

金价明年破5000美元?分析:前提是“美元贬值交易”重新流行

华尔街见闻官方 浏览 702
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1