关闭广告

蚂蚁集团突破性研究:一个视觉"万能钥匙"让AI同时理解和创造图像

科技行者2528人阅读


这项由蚂蚁集团旗下Inclusion AI团队领导的重要研究发表于2025年10月,研究团队包括黄梓源、郑丹丹、邹程等众多研究员。论文题为《Ming-UniVision: Joint Image Understanding and Generation with a Unified Continuous Tokenizer》,感兴趣的读者可以通过arXiv:2510.06590查询完整论文,相关代码和模型已在GitHub、HuggingFace等平台开源。

AI看懂图片和创造图片,原本是两个完全不同的任务,就像一个人既要当翻译官又要当画家。以往的AI系统通常需要分别训练两套完全不同的"大脑"来处理这两种任务。现在,蚂蚁集团的研究团队找到了一种方法,让AI用同一套"视觉语言"既能理解图片内容,又能根据文字描述创造全新的图像。

这个突破性发现的关键在于他们开发

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

中央一号文件来了!今年有哪些“新表述”?

农民日报 浏览 1479

低价“银行直供房”激增,有房产价格低于市价25%

第一财经 浏览 2524

跨境网赌大佬佘智江将被引渡回中国 被指曾参与KK投资

红星新闻 浏览 32382

国家禁止亏本卖车,价格战就能不打了?

汽车公社 浏览 1859

西班牙青训球队开除4名U16球员,他们曾为泄愤持刀威胁对手

懂球帝 浏览 2334

走过那个夏天,甜茶终于站上金球奖之巅

时尚COSMO 浏览 1347

媒体分析:特朗普宣称要"接管"委内瑞拉 有多大可行性

澎湃新闻 浏览 9175

马斯克称新款特斯拉Roadster是“超越汽车范畴的特殊产品”

IT之家 浏览 3589

牛弹琴:美国人大吃一惊 特朗普牵涉到了战争罪行

现代快报 浏览 15334

张家界荒野求生比赛还剩15人 男子靠"续命三件套"出圈

极目新闻 浏览 7845

销售渠道改为“单城单店”模式?丰田中国:仅少数地区试点|早报

汽车服务世界 浏览 2602

中海成都谋变?曝开发公司连亏2年,桐梓林28亩项目寻合作

密探财经 浏览 891

伊姐十一热推:电影《震耳欲聋》;电视剧《三更雪》......

伊周潮流 浏览 2335

苹果发布iPhone 17e:起售价4499元,支持实体+eSIM卡组合

澎湃新闻 浏览 821

销量、价格双双坍塌,二线豪华品牌,已经被国产新能源“挤垮”了

小李车评李建红 浏览 2110

首发权益价5.98万起 星光560动力及安全信息发布

网易汽车 浏览 1936

西伯利亚神经网络公司推出革命性单元测试评估模型

科技行者 浏览 1392

美国被指对伊朗行动的准备在两周内完成

潇湘晨报 浏览 1462

糊了22年,他终于凭借「性张力」火了

独立鱼 浏览 2583

众泰汽车重组出现变数?

车业杂谈 浏览 1425

2026首个巡回赛惨案诞生,萨巴伦卡化身早餐外卖员用时47分钟下班

网球之家 浏览 1719
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1