关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者869人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

朱一龙梁家辉一出手,若不出意外,这部国产大片估计得“封神”

娱乐圈笔娱君 浏览 70

强势搜证提告娱记!大S疑化解危机 葛斯齐改口辩解

娱乐团长 浏览 15605

普里戈任在俄千亿商业帝国已崩溃 除了"瓦格纳"

红星新闻 浏览 15646

新年伊始,自主品牌继续保持强势

辣椒车讯 浏览 12196

李在明出院:气色良好接受采访 呼吁结束仇恨政治

海外网 浏览 12657

AI眼镜厂商,正在集体拒交“智商税”

钛媒体APP 浏览 180

斗鱼回应监管进驻:将优化内容审核机制

网易科技报道 浏览 18051

或将于2027年发布 宝马iX3 M测试谍照曝光

车质网 浏览 796

女孩引产遭拒生女婴被医生"送人" 抱养方称捡弃婴露馅

澎湃新闻 浏览 7373

不建议中年男人背的3种包包,听着洋气,实际土气,廉价又寒酸

潮人志Fashion 浏览 11503

基德:小琼斯喜欢赢球 找不到比他更好的角色球员

直播吧 浏览 12559

独家对话旺仔小乔“榜一大哥”:一场直播曾打赏7万元,让自己别为她难过而改名“别难过”

红星新闻 浏览 968

百度官宣“文心一言”云服务将于3月27日上线

Tech星球 浏览 19471

岸田要求中方撤销水产品进口管制措施 中国大使回击

环球网 浏览 86712

场均2.70分,阿隆索登顶皇马主帅前10场西甲场均拿分榜

懂球帝 浏览 805

奔驰A级车延至2028年,新车型同步推进

MOTO 浏览 1470

过半的2024,中国新能源市场卷出二八效应

智驾网 浏览 10725

欧洲区小组赛出局队全部确定:塞尔维亚、匈牙利、以色列在列

懂球帝 浏览 545

特斯拉员工开Model 3遇车祸身亡 马斯克:那辆车没有FSD

电车圈 浏览 11932

林心如自曝爱花钱,感慨霍建华太节省,网友:不懂二人咋在一起

萌神木木 浏览 747

杨天真打不开自己特斯拉从后备箱爬进去 客服回应

极目新闻 浏览 10299
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1