关闭广告

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者2690人阅读


这项由马里兰大学巴尔的摩分校的Shubhashis Roy Dipta教授与英特尔实验室的Tz-Ying Wu、Subarna Tripathi等研究团队共同完成的研究发表于2024年9月,论文编号为arXiv:2509.16538v1。对于那些想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查找完整论文。

当我们观看一段视频时,如果有人为这个视频写了一段描述文字,你如何判断这段描述是否准确呢?这听起来像是一个简单的问题,但对计算机来说却是一个巨大的挑战。就好比你请朋友帮你描述一幅画,你需要判断朋友的描述是否靠谱——但问题是,你手里没有这幅画的"标准答案"。

传统的做法就像考试时需要标准答案一样。研究人员会让人工写出视频的"正确"描述,然后用这些标准答案来评判其他描述的好坏。但这种方法有个致命问题:获得这些标准答案需要花费大量人力和金钱,而且当我们面对互联网上海量的视频时,根本不可能为每个视频都准备标准答案。

更糟糕的是,现有的评估方法就像一个粗心的老师,经常给错误的答案打高分。研究团队发现,即使一段描述把视频中的小提琴说成吉他,把男人说成女人,现有的评估系

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

深铁再救万科220亿,暗藏的动作太多了

大猫财经Pro 浏览 2215

中国公民需谨慎前往日本 四大原因披露

环球网资讯 浏览 41873

2天挨4 针,韩国皮肤科,挤满“特种兵医美”的中国人

每日人物 浏览 2367

59元钓鱼3小时,年轻人只想静静

中国企业家杂志 浏览 2259

2026 年度载人航天飞行任务标识开始征集

IT之家 浏览 2578

罗体:萨里向洛蒂托要求在一月引进一名高水平中场球员

懂球帝 浏览 2248

失业13个月 35岁巴神官宣登陆西亚2级联赛 已换13队+10年转会10次

我爱英超 浏览 1556

进博面对面|默沙东中国总裁唐凯宇:加速推动医药创新成果落地中国

中国商报 浏览 2643

携程涉嫌垄断被立案调查 尾盘跳水大跌超6%

Daily每日财报 浏览 1640

秦海璐直觉超准!刘宇宁35岁面相改变

智凌纵横 浏览 3606

这几件衣服太火了,谁穿谁好看

LinkFashion 浏览 2324

公安分局公示的三个监督电话打不通 官方回应

大风新闻 浏览 7177

武汉女子遭遇APP投资骗局:起诉被驳回 警方又不立案

上游新闻 浏览 8500

巨星传奇想摆脱“周杰伦依赖”

北京商报 浏览 2463

《营救汪星人》成毅正在透支自己的观众缘

娱乐圈笔娱君 浏览 1457

青甘大环线有老外开敞篷老爷车行驶 有1955款劳斯莱斯

极目新闻 浏览 3826

伊姐十一热推:电影《阿凡达:水之道》;电影《毕正明的证明》......

伊周潮流 浏览 2397

比亚迪双旗舰谍照来了!大汉/大唐,更大、更强

车市红点 浏览 1902

博主:据了解长春亚泰旧将王栋执教中乙长春喜都

懂球帝 浏览 1685

色彩凝聚笔尖,描绘双唇明眸之美

时尚COSMO 浏览 2548

当《蚁人》照进现实: 西湖大学造出能爬会游、摔不坏的“机器小强”

都市快报橙柿互动 浏览 3407
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1