关闭广告

抖音&LV-NUS开源多模态新模,以小博大刷新SOTA,8B推理比肩GPT4o

量子位1041人阅读

SAIL-VL2团队 投稿
量子位 | 公众号 QbitAI

2B模型在多个基准位列4B参数以下开源第一。

抖音SAIL团队与LV-NUS Lab联合推出的多模态大模型SAIL-VL2

SAIL-VL2以2B、8B等中小参数规模,在106个数据集实现性能突破,尤其在MMMU、MathVista等复杂推理基准超越同规模模型,甚至比肩更大参数的闭源模型。



方法上,SAIL-VL2通过数据、训练、架构三大维度的创新,为社区提供“小模型也能有强能力”新范式。

SAIL-VL2既具备细粒度视觉感知能力,又能在复杂推理任务中媲美更大规模模型。同时,团队通过开源模型与推理代码,提供可扩展的多模态基础模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

空姐穿毛衣上班,被吐槽“很土”?

正解局 浏览 638

华为鸿蒙全新MPV曝光!车长5米2,比腾势D9豪华,你看好吗?

网上车市 浏览 11928

她老公是娱乐圈隐形富豪,替父还债12年后火遍亚洲

金融八卦女 浏览 13367

台湾岛内开始抓内鬼,菠萝卖不出去都怪有人泄露种植技术!

趣看热点 浏览 366337

冲绳知事7月将第三次访华:冲绳绝不能再次沦为战场

环球网资讯 浏览 92063

最高涨价28%,老铺黄金年内第三次调价,今年已累计涨约50%

红星资本局 浏览 823

加量不加价 阿维塔11鸿蒙版智享升级版30万起

网易汽车 浏览 12859

市值20亿,成长空间大的龙头,A股小而美企业名单

资本百科 浏览 12931

CDS复兴?“AI发债潮”重燃了市场的“次贷回忆”

华尔街见闻官方 浏览 570

贝嫂素颜出镜翻车,疑眼皮提拉失败额头过度填充

好丹 浏览 12838

蚂蚁集团突破性研究:一个视觉"万能钥匙"让AI同时理解和创造图像

科技行者 浏览 614

投资人接连上门!肿瘤科研成果用于皮肤修复,重庆这家公司成立一年估值3亿

时代周报 浏览 937

业主车位被占后焊栏杆围车 涉事双方:局面失控 先缓缓

潇湘晨报 浏览 120364

白俄女子被骗到缅北 家属被告知其器官被摘除遗体火化

红星新闻 浏览 6021

郭碧婷不惧曝光产后身材 穿泳装露肚腩发际线后移

八怪娱 浏览 14604

秋天穿阔腿裤,选对鞋子才时髦!

LinkFashion 浏览 15263

大一新生开学不久在校死亡 家长在医生的建议下报警

红星新闻 浏览 19816

699元买不了袜子?张雨绮不当言论引争议

新洞察 浏览 17014

有钱人如何安全戴表?有解了

YOKA网 浏览 19442

限时6.58万起 2026款吉利星愿正式上市

网易汽车 浏览 1056

"泥瓦工一家三口半月收入4万"引热议 业内称正常现象

极目新闻 浏览 77374
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1