爆点资讯

这项由牛津大学视觉几何组(VGG)团队开展的研究发表于2025年1月，论文编号为arXiv:2601.09499v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

想象一下，当你在看一段视频时，你的大脑能够同时理解画面中物体的三维形状、它们的运动轨迹，以及摄像机的移动。现在，牛津大学的研究人员成功让计算机也具备了这种"立体视觉"能力。他们开发的V-DPM系统能够从一段普通视频中同时重建出场景的3D结构、物体的运动轨迹，甚至摄像机的参数——这就像给机器装上了一双能够"看透"视频背后三维世界的眼睛。

这项技术的突破性在于，它是首个能够在单次处理中完成所有这些任务的系统。以往的方法要么只能处理静态场景，要么需要多个步骤才能分别处理形状和运动。而V-DPM就像一位全能的"视频分析师"，能够一眼看出视频中的所有三维信息。更令人惊叹的是，研究团队巧妙地利用了在静态场景上训练的现有模型VGGT，通过相对少量的动态数据微调，就让它学会了处理复杂的动态场景——这就像让一位擅长画静物的画家，通过少量练习就学会了画动态人像。

这项研究解决了计算机视觉领域一个长期存在的挑战：如何让机器同

牛津VGG团队突破：单一网络实现视频动态3D重建

新年将至普...

时隔十年上证...

33岁的张一...

停火协议第一...

曼谷偶遇文咏...

＂柴怼怼＂被...

烂！58岁邹兆龙翻拍《怒火重案》，擦边卖肉制作粗糙，票房仅65万

爆破试验带你看巡飞弹飞龙-60A有多强

特朗普：我若遭到暗杀美国将把伊朗“从地球上抹去”

美财长挑拨中阿关系称＂米莱要将中国赶走＂阿根廷回应

上新|| 降温天不能错过的绝美毛衣，来了！

AI代写论文公司曾申请精英人才商标

女友BELLA+封面 | 高杨：步履稳定，心向未知

李在明：韩美贸易谈判僵持美不能给韩带来灾难性后果

厚外套+半裙=今冬绝美穿搭，巨洋气巨显瘦！

“躺平”后，老干妈卖了快54亿

专家:美对委行动或成未来对付其他＂不听话国家＂的先例

盈利大考冲刺关头，千亿小鹏被指“虚假宣传”

12岁小学生自杀遗书称写不会英语单词英语老师:委屈

哈维-西蒙斯：我很享受在热刺的时光；在主场拿下3分很重要

E句话| 马尔福已经成了马年吉祥物？

从胶体物理到创新药，南科大团队提出大分子药物稳定新理论

皮衣+裙子、大衣+运动鞋，这4组搭配照着穿就很时髦！

斯坦福大学团队推出「许可证神谕」：让AI学会说「我不知道」

海军四川舰顺利完成首次航行试验

男子快递从甘肃寄到成都：直飞660公里却绕了2800公里

10月车企交付数据汇总：小米小鹏均超4万，零跑破7万

千问加速进入AI硬件！再推1999元亲民AI眼镜，减价不减配

无显示屏、靠Siri控场？苹果首款眼镜核心功能全曝光

泽连斯基:乌美就领土问题讨论6.5小时