关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者2596人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

苹果被曝开发类ChatGPT应用!专为训练新Siri打造

智东西 浏览 3228

上年纪的女人买“上衣”:避开3个坑,这样选时髦又显气质

静儿时尚达人 浏览 1444

普通人衣服没必要买太多,准备好这些单品,简单实用又耐看

静儿时尚达人 浏览 1412

性能+豪华 星途ES7GT/ES8/ET8/ET9四车发布

网易汽车 浏览 1943

汪小菲又幸福了!和马筱梅搂腰拥抱好缠绵

疯说时尚 浏览 2658

冲刺双重上市,潮宏基还有多少隐忧待解

铑财 浏览 2293

从39%到15%,瑞士对美关税协议达成

环球网资讯 浏览 2507

接到立案通知后,股民以为完了,5个月后一算账,7000人账面翻倍

壹只灰鸽子 浏览 2159

妙可蓝多创始人柴琇遭免职,并被提起仲裁

YOUNG财经 浏览 1549

美国想打造联合国替代机构 该机构章程透露关键信息

上观新闻 浏览 5921

2.8亿债务逾期,良品铺子实控人收执行通知,公司去年预亏超1.2亿

红星资本局 浏览 1402

清华字节跳动首创视频换脸新纪元:让照片主角完美融入视频场景

科技行者 浏览 1607

极氪8X官宣3月16日举办技术发布会,并开启预售

网易汽车 浏览 658

任正非最新讲话:没有网络的算力是信息孤岛

澎湃新闻 浏览 2078

媒体:俄乌战场“飞出”的无人机 为何让欧洲如此忧惧

极目新闻 浏览 4272

贾跃亭发布大消息:旗下机器人业务重大进展

电动知家 浏览 1548

美官员:美军抵达以色列 监督加沙停火协议的执行

环球时报国际 浏览 2801

姆巴佩已完成职业生涯400球,为最年轻达成此成就球员

懂球帝 浏览 2097

女儿手指被门框划伤 父亲获赔后转手捐出

1818黄金眼 浏览 12575

狂砸30亿!阿里千问官宣“春节请客”计划,吃喝玩乐全免单

雷科技 浏览 1327

Nuralogix智能镜亮相CES,可看脸提供“长寿评分”

IT之家 浏览 1759
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1