以繪圖工具將車輛的尺寸稍作調整,或是透過簡單的拖曳動作將笑容變為皺眉,這些應用在當前的圖像編輯技術看來已司空見慣。然而,當我們在看待圖像的同時,能否將其視為一個三維模型,並進一步操作它的角度,使其猶如面對不同方向?現在,這一切都已不再遙不可及。
這項名為「DragGAN」的研究,其功能遠超過 Photoshop 的「Warp」工具,更凌駕於任何現有的圖像編輯工具。相比於僅僅推動像素,這款 AI 工具可以重新生成基底物體。更令人驚奇的是,透過它,我們甚至可以像操作三維圖像一樣去旋轉圖像。
這項新研究成果旨在突破 AI 圖像操控的局限性。簡單的「拖曳」行為,可以使湖面的倒影隨著拖動產生變化,甚至讓山脈的高度因你的點擊而有所升降。然而,這些演示視頻令研究團隊的主頁承受了過大的網路流量壓力,而癱瘓了一段時間。
研究團隊指出,這項研究最有趣的部分不僅僅在於圖像的操作本身,更在於其使用者介面。目前的 AI 圖像生成工具,例如 GANs,可以生成逼真的圖像,但在彈性和精確性上存在許多不足。
而 DragGAN 的出現,清晰地為此問題提供了一個解決方案。在傳統的圖像扭曲操作中,這個模型不僅可以重新生成主題物體,還可以「幻想」出隱藏的內容,例如獅子嘴裡的牙齒,或是馬腿的彎曲狀態。然而,這只是目前的演示未來生成式 AI 在圖像處理的可能性。何時才能真正普及化,仍要有待觀察。