关闭广告

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者2691人阅读


这项由马里兰大学巴尔的摩分校的Shubhashis Roy Dipta教授与英特尔实验室的Tz-Ying Wu、Subarna Tripathi等研究团队共同完成的研究发表于2024年9月,论文编号为arXiv:2509.16538v1。对于那些想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查找完整论文。

当我们观看一段视频时,如果有人为这个视频写了一段描述文字,你如何判断这段描述是否准确呢?这听起来像是一个简单的问题,但对计算机来说却是一个巨大的挑战。就好比你请朋友帮你描述一幅画,你需要判断朋友的描述是否靠谱——但问题是,你手里没有这幅画的"标准答案"。

传统的做法就像考试时需要标准答案一样。研究人员会让人工写出视频的"正确"描述,然后用这些标准答案来评判其他描述的好坏。但这种方法有个致命问题:获得这些标准答案需要花费大量人力和金钱,而且当我们面对互联网上海量的视频时,根本不可能为每个视频都准备标准答案。

更糟糕的是,现有的评估方法就像一个粗心的老师,经常给错误的答案打高分。研究团队发现,即使一段描述把视频中的小提琴说成吉他,把男人说成女人,现有的评估系

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

鑫元基金,出了个年度“亏损王”

深蓝财经 浏览 1689

冬季穿搭要避开臃肿感!配色不老气、穿衣不随意,越看越高级

静儿时尚达人 浏览 777

威斯康星大学突破性发现:AI模型的"视觉盲点"之谜终于有了答案

科技行者 浏览 2653

OPPO AI战略曝光!全场景、全链路,要把 AI 做成系统?

雷科技 浏览 2879

利智输了?李连杰终是没放下一直亏欠的“她”

顾史 浏览 1578

稳增5.6%!武汉GDP站稳2.2万亿

虎投邦 浏览 1393

网络安全AI说丨警惕U盘里的“不速之客”

海外网 浏览 3039

23分钟16+8轻松打卡:30岁李梦仍国产最强锋线 被曝启动留洋计划

颜小白的篮球梦 浏览 2868

央企旗下四川水电开发公司36.79%股权挂牌转让,底价19.3亿元

红星资本局 浏览 1610

不一定能掀桌男主,但一定是个好演员!

伊周潮流 浏览 1480

广东98-89天津2喜2忧!胡明轩拾巅峰状态,焦泊乔受伤,内线被虐

篮球资讯达人 浏览 1533

惨!拍完被雪藏8年,李幼斌耗资1亿拍战争大片,没上映就被判死刑

靠谱电影君 浏览 2515

双巴大战来了!萨巴伦卡、莱巴金娜会师WTA总决赛争冠

懂球帝 浏览 2044

隔空对骂!马斯克与瑞安航空CEO就“星链”安装问题爆发口水战

环球网资讯 浏览 1706

《余生有涯》:就算原生家庭烂,也别劝我投降

澎湃新闻 浏览 2794

汽车行业杂耍式营销何时休?

道哥说车 浏览 1693

47岁余皑磊演戏多年无人问,一演特务众人知

可乐谈情感 浏览 2779

蚂蚁集团首席执行官韩歆毅:以“数智普惠”惠及每一位老百姓

上游新闻 浏览 2417

第五届意大利繁花电影节片单暨日程发布!

幕味儿 浏览 2378

曲协表态仅6天,郭德纲担心的事还是发生

科学发掘 浏览 1958

新机发售之际,荣耀手机影像专家言论争议不断、引翻车质疑

观察者网 浏览 2775
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1