关闭广告

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者3682人阅读


这项由马里兰大学巴尔的摩分校的Shubhashis Roy Dipta教授与英特尔实验室的Tz-Ying Wu、Subarna Tripathi等研究团队共同完成的研究发表于2024年9月,论文编号为arXiv:2509.16538v1。对于那些想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查找完整论文。

当我们观看一段视频时,如果有人为这个视频写了一段描述文字,你如何判断这段描述是否准确呢?这听起来像是一个简单的问题,但对计算机来说却是一个巨大的挑战。就好比你请朋友帮你描述一幅画,你需要判断朋友的描述是否靠谱——但问题是,你手里没有这幅画的"标准答案"。

传统的做法就像考试时需要标准答案一样。研究人员会让人工写出视频的"正确"描述,然后用这些标准答案来评判其他描述的好坏。但这种方法有个致命问题:获得这些标准答案需要花费大量人力和金钱,而且当我们面对互联网上海量的视频时,根本不可能为每个视频都准备标准答案。

更糟糕的是,现有的评估方法就像一个粗心的老师,经常给错误的答案打高分。研究团队发现,即使一段描述把视频中的小提琴说成吉他,把男人说成女人,现有的评估系

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

太空“4S店”要开张:Starfish验证“单眼”卫星交会PRO操作

IT之家 浏览 3057

给她的宇宙,Matthieu Blazy重塑香奈儿女性

时尚COSMO 浏览 3093

在AI面前,我们终于敢脆弱|数字时代的情感避难所『心灵加油站』(274)

我们的太空 浏览 2601

东部战区发布联合演训区公告及示意图

新华社客户端 浏览 2893

双门双座+纯电后驱 全新smart #2将于2026年发布

网易汽车 浏览 2895

真爱大牌 || 用了5年才敢说,多亏它帮我守住了发际线

黎贝卡的异想世界 浏览 2988

第138届广交会10月15日开幕,约3600家企业首亮相,首设智慧医疗专区

红星资本局 浏览 3806

存储芯片涨价潮蔓延,半导体细分龙头业绩“水涨船高”

览富财经网 浏览 2439

"特朗普黄金卡"正式接受申请 从500万降至100万美元

国是直通车 浏览 19780

这俩人原来是夫妻,因拍《红楼梦》结缘

素衣读史 浏览 2884

米体:普利希奇将接受医疗检查,阿莱格里和米兰对美国队不满

懂球帝 浏览 3776

小S哽咽念不了台词!具俊晔「悄现身」低调陪伴

达达哥 浏览 3118

新一代理想L9电池加码体型加大 重夺高端话语权

网易汽车 浏览 2567

智元新增人形机器人生产订单超万台,具身本体路线还能卷多久? | 独家

钛媒体APP 浏览 533

一架无人机保护区拍鸟群致鸟摔死 无人机被人悄悄捡走

中国新闻周刊 浏览 10468

全智贤近况曝光!44岁了放弃谍战剧去拍偶像剧,资源降级遭群嘲

萌神木木 浏览 3463

央视年代剧《老舅》开播!这部剧又要火向全国

皮皮电影 浏览 2331

起底Plaud不融资却卖100万台的秘密

虎嗅APP 浏览 3366

被自称前女友的网友实名举报涉毒 短剧"顶流":别搞我

极目新闻 浏览 6888

熊园:9月进出口均走高的背后

首席经济学家论坛 浏览 3762

特朗普:若俄乌冲突无法解决 可能会供乌“战斧”

界面新闻 浏览 3778
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1