关闭广告

AWS推出AI图像编辑新突破:用说话就能精准移动图片中的物体!

科技行者2721人阅读


这项来自香港中文大学、AWS智能AI部门、亚马逊云服务和亚马逊机器人团队的联合研究发表于2025年1月,论文编号为arXiv:2601.02356v1。研究团队由谭靖、张兆阳、沈彦涛、蔡嘉瑞等多位学者组成,有兴趣深入了解的读者可以通过该编号查询完整论文。

想要修改照片里的物体位置,过去总是需要专业的图像处理软件和复杂的操作技巧。现在,AWS的研究团队开发出一种全新的AI系统叫做TALK2MOVE,只需要简单地说出你的想法,比如"把杯子往左移动"或者"把椅子转90度",AI就能准确地完成这些操作。这就像拥有了一个非常聪明的助手,能够完全理解你的语言指令并在照片中精准执行。

这项研究的核心创新在于采用了强化学习的训练方式,可以把它理解为让AI通过反复练习来学会精准操作的过程。不同于传统方法需要大量配对的"修改前后"图片来训练,TALK2MOVE采用了一种更加聪

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

妈妈辈也能轻松穿出高级感:3个实用穿搭法则,优雅不费力

静儿时尚达人 浏览 3534

怒放竞技场3V3街头足球赛玉溪站落幕,奥斯卡、约尼查助阵

懂球帝 浏览 3523

17.64亿!理想MEGA召回预估成本创纪录,主动担责撬动行业规范变革|封面独家

封面新闻 浏览 3563

DeepSeek崩了,官网:正在修复

大象新闻 浏览 228

缅北四大电诈头目被押解回国 特写画面首次披露

大风新闻 浏览 8312

国安部:有间谍入住海景民宿偷拍军港 被老板识破

央视新闻客户端 浏览 3839

美官员:美军抵达以色列 监督加沙停火协议的执行

环球时报国际 浏览 3767

中期改款奔驰AMG SL曝光 前脸焕新 依旧多种动力

汽车公告板 浏览 2550

卫星图像显示伊朗恰巴哈尔港附近海域现多艘油轮

财联社 浏览 32932

预计年内发布 奔驰GLC EV内饰谍照曝光

车质网 浏览 2762

三星被曝2026年发新款折叠屏手机,屏幕超7英寸、护照式设计,叫板苹果

智东西 浏览 2995

美政府部分“停摆”最早将于周二结束

国际金融报 浏览 2371

前三季度应收账款激增603.71%,卤味巨头煌上煌靠收购和补贴撑利润?

时代周报 浏览 3690

中国移动成功举办“AI赋能医院后勤管理新发展”论坛

北青网-北京青年报 浏览 3157

卢浮宫盗贼没偷6000万美元钻石 其它被盗藏品或被熔化

极目新闻 浏览 9477

圣桐特医再度递表 财务紧绷难解

北京商报 浏览 2946

“恐怖电影成真” 美国男子盗窃人骨公开售卖

澎湃新闻 浏览 7939

特斯拉Model3/ModelY Standard正式发布

网易汽车 浏览 3733

伊朗称美国在伊核问题上“没有认真的谈判态度”

国际在线 浏览 3229

热火106-103险胜雄鹿取6连胜,希罗29+5+7,阿德巴约17+11

懂球帝 浏览 3149

户外品牌除了炸山就没有出路了吗?

诗与星空 浏览 3609
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1