关闭广告

GUI自动化的新突破:ServiceNow让AI更准确定位屏幕界面元素

科技行者790人阅读


这项由ServiceNow、魁北克人工智能研究院、蒙特利尔大学、约克大学、蒙特利尔理工学院和麦吉尔大学联合进行的研究发表于2025年10月,论文编号为arXiv:2510.03230v1。研究团队由王苏宇辰、张天宇、Ahmed Masry、Christopher Pal、Spandana Gella、刘邦和Perouz Taslakian等学者组成,他们致力于解决人工智能在GUI(图形用户界面)自动化中面临的核心难题。有兴趣深入了解的读者可以通过论文编号arXiv:2510.03230v1查询完整论文。

现代生活中,我们每天都要与各种软件界面打交道——从手机应用到电脑程序,从网页浏览到办公软件。如果能让人工智能像人类一样准确地识别和操作这些界面元素,将会极大提升工作效率。然而,要让AI准确找到屏幕上的按钮、文本框或菜单项,就像要求一个从未见过地图的人在陌生城市中找到特定建筑物一样困难。

这项研究的核心贡献在于解决了当前视觉语言模型在GUI定位任务中的一个根本性问题:如何将自然语言指令准确转换为屏幕上的像素坐标。研究团队发现,现有方法就像让一个盲人通过触摸来画地图一样效率低下,因为AI模型需要在没有明确参照物的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

北约鼓动乌克兰打击俄罗斯本土,意大利已发飙

浏览 10964

连夜变现289万元!“每天见证历史!”网友懵了:该买还是卖?

每日经济新闻 浏览 12283

埃及防空系统击落一不明飞行物

央视新闻客户端 浏览 12729

贾玲减了100斤!袁弘3次编辑微博疑质疑,网友斥其卖惨营销惹争议

缘木不求娱 浏览 12664

央行重磅会议释放新信号!下半年行情开门红可期?

每日经济新闻 浏览 15654

戒掉 “大锅饭”,阿里 “回头是岸”

钛媒体APP 浏览 14741

载誉归!中国足球小将09/10队已经凯旋回国!西班牙之旅7胜2平

直播吧 浏览 15326

以军再袭约旦河西岸 巴方谴责以“吞并”企图

国际在线 浏览 257

经典与创新的时代对话,保时捷携两款911登陆第八届进博会

观察者网 浏览 629

我,天权,让东方甄选掉粉70万,老俞让我提前复播

态℃ 浏览 12748

上市1月破发20%!“空调屠夫”奥克斯,对不起基石投资者

深蓝财经 浏览 969

距莫斯科约100公里乌克兰无人机越境偷袭

环球网资讯 浏览 19164

最后一搏!邮报:沙特代表团抵达伦敦,将正式2亿镑报价萨拉赫

直播吧 浏览 14216

保安打人赔35万结案13年后15人被公诉 被害人从未控告

澎湃新闻 浏览 6843

被翻盘,冰岛80分钟后被乌克兰打入两球,连续两届无缘世界杯

懂球帝 浏览 541

零食很忙,果然很忙!估值超百亿,获上市公司7亿增资

证券时报e公司 浏览 12795

成吉思汗一共有几个儿子几个女儿

趣看热点 浏览 25879

自动驾驶技术未成熟,丰田巴士撞倒行人,残奥会出意外

撩车视界 浏览 20174

配置升级 2026款雷克萨斯LS官图正式发布

车质网 浏览 1404

以军一天内93次袭击加沙致70人死亡

国际在线 浏览 1005

内维尔&基恩:曼联不应留下德赫亚,球队需要一名世界级门将

直播吧 浏览 15474
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1