超越 Photoshop　DragGAN 讓你像旋轉三維模型一樣操作圖像

以繪圖工具將車輛的尺寸稍作調整，或是透過簡單的拖曳動作將笑容變為皺眉，這些應用在當前的圖像編輯技術看來已司空見慣。然而，當我們在看待圖像的同時，能否將其視為一個三維模型，並進一步操作它的角度，使其猶如面對不同方向？現在，這一切都已不再遙不可及。

這項名為「DragGAN」的研究，其功能遠超過 Photoshop 的「Warp」工具，更凌駕於任何現有的圖像編輯工具。相比於僅僅推動像素，這款 AI 工具可以重新生成基底物體。更令人驚奇的是，透過它，我們甚至可以像操作三維圖像一樣去旋轉圖像。

這項新研究成果旨在突破 AI 圖像操控的局限性。簡單的「拖曳」行為，可以使湖面的倒影隨著拖動產生變化，甚至讓山脈的高度因你的點擊而有所升降。然而，這些演示視頻令研究團隊的主頁承受了過大的網路流量壓力，而癱瘓了一段時間。

研究團隊指出，這項研究最有趣的部分不僅僅在於圖像的操作本身，更在於其使用者介面。目前的 AI 圖像生成工具，例如 GANs，可以生成逼真的圖像，但在彈性和精確性上存在許多不足。

而 DragGAN 的出現，清晰地為此問題提供了一個解決方案。在傳統的圖像扭曲操作中，這個模型不僅可以重新生成主題物體，還可以「幻想」出隱藏的內容，例如獅子嘴裡的牙齒，或是馬腿的彎曲狀態。然而，這只是目前的演示未來生成式 AI 在圖像處理的可能性。何時才能真正普及化，仍要有待觀察。