关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者885人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

普京称愿基于现实重启谈判后 泽连斯基:当前停火很危险

澎湃新闻 浏览 10962

陈建州方未缴清10万民事裁判费 逾期起诉或被驳回

网易娱乐 浏览 16164

最高降7万元!特斯拉降价潮蔓延,S/X现车优惠,下一个是谁?

澎湃新闻 浏览 14060

政策利率带动LPR下行,存量房贷下调空间大

华夏时报 浏览 16294

乌议员接受美媒采访:乌克兰有"自由世界第二强军队"

环球网资讯 浏览 12333

高市早苗:希望尽早见到特朗普

中国青年报 浏览 12743

开发商未批先建楼盘烂尾5年 13次专题会督促解决未果

鲁中晨报 浏览 64319

中国的AI论文发表量全球第一,为什么没搞出ChatGPT?

观察者网 浏览 35618

普通人冬天就该这么穿,衣服不昂贵、搭配不老气,简单又日常

静儿时尚达人 浏览 246

俄罗斯发动空袭 基辅遭受"自开战以来最大规模袭击"

北京日报客户端-长安街知事 浏览 116567

日在野党提议自卫队改名国防军 中方回应

北京青年报-北京头条 浏览 1523

文班谈明年回家乡打巴黎赛:这将是我生命中最激烈&珍贵的比赛之一

直播吧 浏览 12881

希腊航运巨头28岁女继承人死于虫咬 误诊细节披露

新民周刊 浏览 11904

韩媒曝李俊昊林允儿恋爱,合作新剧前就已交往

网易娱乐 浏览 16129

赚翻了!刘建宏力挺李铁后续,开直播数万人观看:挂小黄车

天涯沦落人 浏览 12648

银河E8,注定成为“颠覆者”

网易汽车 浏览 12965

空军西安飞行学院某旅开展跨昼夜飞行训练

人民资讯 浏览 12800

日媒叫嚣将协防台湾,不过是向主子点头哈腰罢了

趣看热点 浏览 26570

专家:俄乌“和平计划”应触及冲突发生深层原因

环球网资讯 浏览 266

财经早餐:中秋国庆旅游市场迎热潮;摩尔线程IPO过会拟募资80亿元

网易财经 浏览 1454

京东重启低价策略,“百亿补贴”会是对抗拼多多的良药吗?

财联社 浏览 19559
X
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1