关闭广告

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者910人阅读


这项由马里兰大学巴尔的摩分校的Shubhashis Roy Dipta教授与英特尔实验室的Tz-Ying Wu、Subarna Tripathi等研究团队共同完成的研究发表于2024年9月,论文编号为arXiv:2509.16538v1。对于那些想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查找完整论文。

当我们观看一段视频时,如果有人为这个视频写了一段描述文字,你如何判断这段描述是否准确呢?这听起来像是一个简单的问题,但对计算机来说却是一个巨大的挑战。就好比你请朋友帮你描述一幅画,你需要判断朋友的描述是否靠谱——但问题是,你手里没有这幅画的"标准答案"。

传统的做法就像考试时需要标准答案一样。研究人员会让人工写出视频的"正确"描述,然后用这些标准答案来评判其他描述的好坏。但这种方法有个致命问题:获得这些标准答案需要花费大量人力和金钱,而且当我们面对互联网上海量的视频时,根本不可能为每个视频都准备标准答案。

更糟糕的是,现有的评估方法就像一个粗心的老师,经常给错误的答案打高分。研究团队发现,即使一段描述把视频中的小提琴说成吉他,把男人说成女人,现有的评估系

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

净支出仅3180万欧元!德布劳内大伤缺阵数月,曼城应该砸谁?

直播吧 浏览 14368

心水了好久的4个新中式牌子,一口气分享给你们

黎贝卡的异想世界 浏览 11611

杜特尔特警告菲战争风险:原因是美国在菲拥有基地

环球网资讯 浏览 15697

今年最好看的10件半裙

LinkFashion 浏览 16398

日本新首相高市早苗上台,日美同盟是共振还是错位

环球网资讯 浏览 841

360万克六选错队?三分23中5太铁 33岁亚一控失球权已完全迷失

颜小白的篮球梦 浏览 1016

章子怡醒醒给汪峰打电话:哈尔滨冷记着多穿衣服

观察鉴娱 浏览 552

未婚未育男子将遗产留给外甥遗嘱却写错名字 法院判了

环球网 浏览 6493

捷途梁海明:“四个坚持”破局 用户共创+战略深化启新程

网易汽车 浏览 368

揭秘曾经的中国全民内衣品牌造假:股价闪崩

清流Plus 浏览 27035

“平安家医”春节服务超65万人次,日均服务超8.6万人次

网易科技频道 浏览 12191

乌迪内斯主帅:扎尼奥洛重返罗马会很激动,即使不是罗马每个人都喜欢他

懂球帝 浏览 683

Adriana 颜值回春,重回十八岁!

下水道男孩 浏览 13637

大坝被毁当天联合国发文庆祝"俄语日" 乌克兰不满

环球网资讯 浏览 16418

《纽约时报》更新服务条款,禁止将新闻报道用于AI开发

澎湃新闻 浏览 14323

乌向美提交首份集束炸弹使用报告 含摧毁俄目标数

环球网资讯 浏览 15508

日本自卫队拟使用"星链" 增强离岛作战能力

澎湃新闻 浏览 15538

一连三部电影撤出春节档,给行业带来什么启示?

钛媒体APP 浏览 12743

学会这些让小个子女生时髦一整个冬天

Yuki女人故事 浏览 13224

九十年代的双生传奇:菲亚特Bravo与Brava

老爷车 浏览 700

现任女市委书记至少20人 其中2人系中央候补委员

上观新闻 浏览 81845
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1