关闭广告

小米研究院推出AI视频理解:让机器像人一样"回看"思考视频内容

科技行者2597人阅读


这项由小米人工智能实验室(MiLM Plus)的李佳泽领导,联合独立研究者以及中国人民大学团队合作完成的研究,发表于2025年11月的计算机视觉领域顶级会议论文中。有兴趣深入了解的读者可以通过论文编号arXiv:2511.13026v1查询完整论文。

当你在看一部长电影时,如果朋友突然问你"刚才那个场景里谁救了谁",你可能会本能地回想刚才看到的画面,重新审视那些关键镜头。现在,研究团队让人工智能也学会了这种"回看思考"的能力。

目前的AI视频理解系统就像一个只能"一遍过"看视频的观众,看完就必须立即给出答案,不能重新检查可能遗漏的重要细节。特别是面对长视频时,这种限制变得更加明显。就好比你被要求看完一部两小时的电影后,不允许回想任何情节就要回答复杂问题一样困难。

研究团队发现了现有AI系统的一个重要缺陷:当这些系统

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

石破茂讲话让高市早苗恼羞成怒:不知道他在说什么

上观新闻 浏览 6442

缺席训练!曝25岁主力门将遭申花“三停”,上轮中超赛后通宵泡吧

我爱英超 浏览 3675

“双11”本地之战|淘宝便利店剑指美团腹地 电商巨头激战线下“最后一公里”

北京商报 浏览 3530

伊称3天内完成核协议草案 美最大核动力航母进入地中海

环球网资讯 浏览 1985

刘强东和滴滴程维杀入家政市场 不拼司机拼上阿姨了?

BT财经 浏览 2851

CounterPoint称2025Q4印度手机市场联发科斩获48%份额

IT之家 浏览 1651

美军称在东太平洋打击一“贩毒船” 致4人死亡

极目新闻 浏览 3022

黄一鸣才真清醒,大四怀孕不做“首富太太”

柠檬有娱乐 浏览 3104

16倍大牛股天普股份遭证监会立案,公司市值已从不足17亿增至292亿元

红星资本局 浏览 2633

清华新作ControlAudio:声音何时响、说啥话?都能按剧本可控生成

机器之心Pro 浏览 760

11月新车申报爆冷!车企们要集体“躺平”?误会了!

雷科技 浏览 3400

【英超】德利赫特头球绝平 曼联2比2客平热刺

体坛周报 浏览 3551

汕头火灾致12人遇难 幸存家属讲述逃生细节

红星新闻 浏览 20143

伊朗未爆弹药爆炸 革命卫队14人死亡

新华社 浏览 273

M3旅行版上市售94.39万元 告别平行进口

网易汽车 浏览 3414

零百2.5s 保时捷纯电Cayenne北京车展首发

车质网 浏览 2455

张家界荒野求生赛剩1名女选手:瘦得判若两人 称想吃肉

现代快报 浏览 9541

终结5连败!鲍威尔24分热火力克篮网 热巴8+17小波特28分

醉卧浮生 浏览 2862

图片报:塔踩到了斯塔尼希奇此前受伤的右脚,使其退出训练

懂球帝 浏览 2377

美顶级战机制造商干涉台湾被大陆制裁 进入"慢性死亡"

博览历史 浏览 6137

智己LS9开启预售,33.69万元起颠覆大六座市场

林林Go 浏览 3498
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1