关闭广告

GUI自动化的新突破:ServiceNow让AI更准确定位屏幕界面元素

科技行者792人阅读


这项由ServiceNow、魁北克人工智能研究院、蒙特利尔大学、约克大学、蒙特利尔理工学院和麦吉尔大学联合进行的研究发表于2025年10月,论文编号为arXiv:2510.03230v1。研究团队由王苏宇辰、张天宇、Ahmed Masry、Christopher Pal、Spandana Gella、刘邦和Perouz Taslakian等学者组成,他们致力于解决人工智能在GUI(图形用户界面)自动化中面临的核心难题。有兴趣深入了解的读者可以通过论文编号arXiv:2510.03230v1查询完整论文。

现代生活中,我们每天都要与各种软件界面打交道——从手机应用到电脑程序,从网页浏览到办公软件。如果能让人工智能像人类一样准确地识别和操作这些界面元素,将会极大提升工作效率。然而,要让AI准确找到屏幕上的按钮、文本框或菜单项,就像要求一个从未见过地图的人在陌生城市中找到特定建筑物一样困难。

这项研究的核心贡献在于解决了当前视觉语言模型在GUI定位任务中的一个根本性问题:如何将自然语言指令准确转换为屏幕上的像素坐标。研究团队发现,现有方法就像让一个盲人通过触摸来画地图一样效率低下,因为AI模型需要在没有明确参照物的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

新中式火出圈:马面裙2个月卖5亿 有簪花店主日入数万

潇湘晨报 浏览 69877

美联储降息、买短债,鲍威尔偏鸽,美股、短期美债、黄金涨,美元跌,比特币震荡

华尔街见闻官方 浏览 82

阮经天小20岁的千金女友曝光

今古深日报 浏览 76

媒体:安世中国第3次硬核回击荷兰 已获国家强势撑腰

看看新闻Knews 浏览 5892

曼联今夏恐无法清洗马夏尔!其复出日期曝光,或发奋争取加薪续约

罗米的曼联博客 浏览 16464

一心堂反复违规背后:实体药店盈利难题未解

北京商报 浏览 11241

马上评|快递柜免费保管时间该多长,谁说了算?

澎湃新闻 浏览 10779

沪广VS深渝,冰火两重天

博闻财经 浏览 10729

你好李焕英票房破53亿,贾玲成为全球票房最高女导演

趣看热点 浏览 25869

多图预警!赵继伟妻子晒在澳门的游玩照

直播吧 浏览 14348

极兔速递三季度包裹量76.8亿件,同比增长23.1%

封面新闻 浏览 1006

南安普顿官方:与主帅拉塞尔-马丁续约3年,上赛季带队冲超

直播吧 浏览 10695

中国手机厂商印度劫:查税与搜查后 要求引入印资

时代周报 浏览 16251

媒体:中方对菲船只的行动安排精妙 美想帮忙没理由

直新闻 浏览 14816

满脸雀斑也不妨碍她们当女神!

ChicMyGeek 浏览 19571

陈赫持股贤合庄被列入经营异常 其为第一大合伙人

网易娱乐 浏览 19439

房东否认李湘主动打扫后退租到底是怎么回事?

趣看热点 浏览 26147

最高续航达610km 江铃羿驰05S上市售9.79万元

网易汽车 浏览 887

在迎来更多国际承认之际 巴勒斯坦领土已"所剩无几"

参考消息 浏览 16391

林永健批顶流进组带编剧乱改戏,网友总结合作演员,成毅被质疑

萌神木木 浏览 1045

最值得借鉴的40+穿搭!简约还舒适,保暖、时髦两不误

静儿时尚达人 浏览 13419
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1