关闭广告

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者3684人阅读


这项由马里兰大学巴尔的摩分校的Shubhashis Roy Dipta教授与英特尔实验室的Tz-Ying Wu、Subarna Tripathi等研究团队共同完成的研究发表于2024年9月,论文编号为arXiv:2509.16538v1。对于那些想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查找完整论文。

当我们观看一段视频时,如果有人为这个视频写了一段描述文字,你如何判断这段描述是否准确呢?这听起来像是一个简单的问题,但对计算机来说却是一个巨大的挑战。就好比你请朋友帮你描述一幅画,你需要判断朋友的描述是否靠谱——但问题是,你手里没有这幅画的"标准答案"。

传统的做法就像考试时需要标准答案一样。研究人员会让人工写出视频的"正确"描述,然后用这些标准答案来评判其他描述的好坏。但这种方法有个致命问题:获得这些标准答案需要花费大量人力和金钱,而且当我们面对互联网上海量的视频时,根本不可能为每个视频都准备标准答案。

更糟糕的是,现有的评估方法就像一个粗心的老师,经常给错误的答案打高分。研究团队发现,即使一段描述把视频中的小提琴说成吉他,把男人说成女人,现有的评估系

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

浙大突破:经验学习提升AI智能体现实世界物理认知

科技行者 浏览 2480

ELLE风尚盛典秒变菜市场,有人摔倒、有人调侃内涵,状况百出

Yuki女人故事 浏览 2935

三年三倍!现货黄金触及5300美元高位

21世纪经济报道 浏览 2406

今年以来最亮彗星现身天际,它的名字叫“莱蒙”

新华社 浏览 3648

镜报:阿联酋财团准备收购曼联股份,小贝或任此次收购代言人

懂球帝 浏览 3792

先锋来袭 丰田卡罗拉概念车新车图解

车质网 浏览 1960

李湘要气炸了!王诗龄封面脚被P成“双右脚”,芭莎无回应惹争议

乌娱子酱 浏览 3136

西安突降暴雪航班大面积延误 旅客:被迫在机场跨年

封面新闻 浏览 17567

无方向盘设计 曝特斯拉Cybercab路试谍照

车质网 浏览 2899

每体:腓骨骨折的邦马蒂将接受手术,或将伤缺5个月

懂球帝 浏览 3052

搭猎鹰500辅助驾驶 全新奇瑞QQ3将于4月上市

车质网 浏览 2556

极氪8X车型最新谍照曝光,展示尾灯造型

IT之家 浏览 2873

特朗普:加沙"和平委员会"已成立

新京报 浏览 2660

今年第三次!53万的理想MEGA烧了,奶爸:不敢想象

说财猫 浏览 3569

闭店风波后,实探“上上谦”仅存门店:薛之谦曾入股,周末用餐高峰仍需排队

时代周报 浏览 3452

五粮液前董事长李曙光被“双开”!卖酒类经销权牟利数额巨大,更多细节公布……

国际金融报 浏览 3634

翁青雅被官媒点名,言辞直戳其肺管子

娱乐圈笔娱君 浏览 3430

特朗普:我不知道还能活多久 很多人都想置我于死地

扬子晚报 浏览 38184

成都事故后,雷军最新发声

都市快报橙柿互动 浏览 3678

83亿港元“互持”,顺丰与极兔的双向奔赴能否实现1+1>2?

征探财经 浏览 2637

宝刀不老,34岁加纳老将乔丹-阿尤献7球7助攻率队直通世界杯

懂球帝 浏览 3864
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1