关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者2592人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

官方:帕拉迪诺成为亚特兰大新主帅,签约至2027年6月

懂球帝 浏览 2401

智元新一代机器人精灵G2已获数亿元订单,并开启首批商用交付

财闻 浏览 2837

瑞典官宣解雇49岁主帅 4轮仅1分+无缘直通世界杯 用废英超2亿双星

我爱英超 浏览 2839

AI抢产能、车厂抢内存,这场博弈中国车企如何破局?

百姓评车 浏览 1440

廷贝尔:联赛杯决赛也许能成为争冠动力;哈弗茨不是安静的人

懂球帝 浏览 1376

宝马5系车主揪出汽修店一个"意外疏忽":我气得吐血

1818黄金眼 浏览 5331

埃尔多安专机在空中一直盘旋 确认以总理不参会才降落

红星新闻 浏览 7799

23岁中国女导演在柬埔寨坠亡 头部与身体遭受严重撞击

红星新闻 浏览 5220

弗里克:首先要不失球;费兰明天能上

懂球帝 浏览 1452

吉利银河V900预售31.98万起 规模效应能否护航?

网易汽车 浏览 1758

伊朗:3117人在骚乱中死亡 2427人是民众和执法人员

界面新闻 浏览 1495

从“辅助”到“自动”,我们该如何与AI共驾未来?

观察者网 浏览 2444

38岁尹正再破天花板,这一次,他让整个娱乐圈“沉默”了

温柔娱公子 浏览 2027

美对委军事打击造成至少40人死亡

界面新闻 浏览 1694

质选车:丰田RAV4荣放以全球品质再续辉煌

车质网 浏览 1934

第二代腾势D9插混版亮相 搭载闪充技术

网易汽车 浏览 530

下一部新剧被曝又是大女主!杨紫真要拍不过来了

星寒新影视 浏览 1960

一篇搞懂:飞书多维表格、n8n、Dify 等自动化工作流里的 Webhook 到底是个啥

钛媒体APP 浏览 2796

赵心童:要学会带着压力享受比赛;特别爱吃陕西面食和葫芦鸡

懂球帝 浏览 2971

最牛退休女工,靠卖易拉罐,纳税100亿

创业家 浏览 2791

"兔子警官"入围最美浙警 曾因执勤视频在网络上走红

环球网资讯 浏览 12979
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1