关闭广告

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者900人阅读


这项由马里兰大学巴尔的摩分校的Shubhashis Roy Dipta教授与英特尔实验室的Tz-Ying Wu、Subarna Tripathi等研究团队共同完成的研究发表于2024年9月,论文编号为arXiv:2509.16538v1。对于那些想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查找完整论文。

当我们观看一段视频时,如果有人为这个视频写了一段描述文字,你如何判断这段描述是否准确呢?这听起来像是一个简单的问题,但对计算机来说却是一个巨大的挑战。就好比你请朋友帮你描述一幅画,你需要判断朋友的描述是否靠谱——但问题是,你手里没有这幅画的"标准答案"。

传统的做法就像考试时需要标准答案一样。研究人员会让人工写出视频的"正确"描述,然后用这些标准答案来评判其他描述的好坏。但这种方法有个致命问题:获得这些标准答案需要花费大量人力和金钱,而且当我们面对互联网上海量的视频时,根本不可能为每个视频都准备标准答案。

更糟糕的是,现有的评估方法就像一个粗心的老师,经常给错误的答案打高分。研究团队发现,即使一段描述把视频中的小提琴说成吉他,把男人说成女人,现有的评估系

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

章莹颖遇难6年 父亲:女儿男友非常善良 至今未婚

大象新闻 浏览 90032

别太担心美股开年的疲软,这可能只是“宿醉”

巴伦周刊 浏览 12564

胡塞武装:只要是美国的船只 都会成为我们的目标

极目新闻 浏览 76491

你恐慌我贪婪!约500亿资金借道ETF蜂拥进场,主力机构正重金下注这些板块(附名单)

每经牛眼 浏览 986

"最快女护士"张水华获得"复出"后首个全马冠军

纵览新闻 浏览 5681

谁的责任?荷兰禁区7人“站桩”,克罗地亚轻松传中破门

直播吧 浏览 16254

财经作家、大V吴晓波被禁言

每日经济新闻 浏览 15713

E句话| 《繁花》剧组又回应了?

仙女事件簿 浏览 662

泰国止步16强!魔咒延续52年,被新帅激活,5个月后将战国足

奥拜尔 浏览 12641

张丹峰洪欣合体逛内衣店秀恩爱 目的是直播带货

传媒一班 浏览 15441

修杰楷回应吴京贾静雯牵手 称自己完全信任另一半

网易娱乐 浏览 16976

最高续航达610km 江铃羿驰05S上市售9.79万元

网易汽车 浏览 882

命中注定!舅舅介绍丁真走红经过拍丁真纯属机缘巧合

趣看热点 浏览 26355

特朗普扬言要撒"关税红利":反对关税的人都是傻瓜

财联社 浏览 6132

布鲁斯-布朗:通过小迈克尔-波特买的11号 本以为他会要得更多

直播吧 浏览 12757

HuggingFace发布实战指南,从决策到落地手把手教你训练大模型

机器之心Pro 浏览 612

新华社权威快报|我国生成式人工智能用户规模超5亿

新华社 浏览 962

“中国建议”在达沃斯受欢迎

环球时报国际 浏览 12634

MIT最新发现:这十年,算法进步被高估了

机器之心Pro 浏览 64

德章泰-穆雷、吹羊、杰伦-约翰逊同砍至少25分5助 老鹰队史首次

直播吧 浏览 12481

新东方员工发文吐槽「加班成奴」,账号被秒封!公司回应;负债238亿拟花1.8亿炒股?乐视网:被误读;美光停止向消费者销售存储产品

雷峰网 浏览 187
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1