关闭广告

AWS推出AI图像编辑新突破:用说话就能精准移动图片中的物体!

科技行者1681人阅读


这项来自香港中文大学、AWS智能AI部门、亚马逊云服务和亚马逊机器人团队的联合研究发表于2025年1月,论文编号为arXiv:2601.02356v1。研究团队由谭靖、张兆阳、沈彦涛、蔡嘉瑞等多位学者组成,有兴趣深入了解的读者可以通过该编号查询完整论文。

想要修改照片里的物体位置,过去总是需要专业的图像处理软件和复杂的操作技巧。现在,AWS的研究团队开发出一种全新的AI系统叫做TALK2MOVE,只需要简单地说出你的想法,比如"把杯子往左移动"或者"把椅子转90度",AI就能准确地完成这些操作。这就像拥有了一个非常聪明的助手,能够完全理解你的语言指令并在照片中精准执行。

这项研究的核心创新在于采用了强化学习的训练方式,可以把它理解为让AI通过反复练习来学会精准操作的过程。不同于传统方法需要大量配对的"修改前后"图片来训练,TALK2MOVE采用了一种更加聪

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

活塞108-105险胜太阳,阿伦空砍33分,活塞关键时刻连丢罚球

懂球帝 浏览 1621

宝马将采取油电并存策略,董事会成员高乐称“内燃机永不会消失”

IT之家 浏览 3586

「新消费观察」折扣店洗牌开始?好特卖多地闭店:“高成本选址”与“低价模式”矛盾凸显

华夏时报 浏览 1969

宽基ETF被抢筹,市场风格走向何方?

国际金融报 浏览 1976

拒绝被逆转,曼联本赛季英超领先后保持不败

懂球帝 浏览 2501

俄代表:美国侵略委内瑞拉意味着"无法无天时代的回归"

环球网 浏览 5387

巴基斯坦夜袭阿富汗边境地区 打死至少70名武装人员

新华社 浏览 2816

熊园:9月财政有喜有忧,今年预算能完成吗?

首席经济学家论坛 浏览 2784

乌国家科学院人口研究所:乌人口规模或将下降三成

红星新闻 浏览 2047

茅台失去的十年

锦缎研究院 浏览 1903

起底Plaud不融资却卖100万台的秘密

虎嗅APP 浏览 2410

慢镜头:莫塔不会回归尤文,但他的合同会影响尤文选帅

懂球帝 浏览 2636

反转!曝何超莲婚礼是亲妈出钱,窦骁不愿签婚前协议,所以没领证

萌神木木 浏览 2567

大电池增程成风,车企在堆料自嗨?

帮宁工作室 浏览 2292

俄方:乌克兰袭击赫尔松地区目标致超20人死亡

环球网资讯 浏览 1816

重要信号,楼市将变!

博闻财经 浏览 2056

鸿蒙与它的1000万“合伙人”

雪豹财经社 浏览 2107

当你的代码测试出问题时,人工智能能像专业程序员一样修复吗?

科技行者 浏览 1332

哈马斯称将把加沙地带行政控制权移交临时委员会

环球网资讯 浏览 2563

私募代持“罗生门”:15万“友情投”被净值击穿

华尔街见闻官方 浏览 1962

纯爽片,真用心,值得被更多人看见!

吐槽电影院 浏览 975
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1