Adobe 在去年推出了其人工智能影像生成模型 Firefly,宣稱該 AI 模型主要使用 Adobe Stock 的數以億計的授權影像進行訓練。Adobe 聲稱,Firefly 是一個相較於其他競爭對手,如 Midjourney,使用從網際網路大量抓取影像訓練的「商業安全」選擇。然而,背後實際上 Adobe 也部分依賴來自這些競爭對手的人工智能生成內容來訓練 Firefly,這一點從未在眾多關於 Firefly 安全性的公開發表和貼文中被明確提及。
AI 模型多用網上圖訓練
訓練人工智能型號所需的大量資料正在受到越來越多的關注,尤其是在使用有版權的材料進行此過程中。Midjourney、Dall-E 的開發者 OpenAI 和 Stable Diffusion 的製造商 Stability AI 等公司建立他們的媒體生成型號時,採取了從網際網路搜集影像的做法,這引起了眾多藝術家的憤怒和訴訟。西安大略大學的助理教授 Luke Stark 表示,這揭示了「負責任的人工智能」定義的不明確性,也顯示了擺脫法律或社會文化問題的困難。
Firefly 以 AI 生成影像訓練引道德爭議
儘管 Adobe 曾公開批評其他公司的資料搜集實踐,但公司內部對於吸收人工智能生成影像到 Firefly 型號中的倫理和形象存在分歧。有員工建議逐步淘汰這些生成影像,但據了解目前沒有這樣的計劃。Adobe 的高級副總裁 Ashley Still 在本月初一次《彭博》智庫活動中提到,企業客戶對 Adobe 的做法表示讚賞,因為他們不會像其他公司那樣,在公開網路上竊取知識產權。
透明度問題
儘管 Adobe 在其網站和網誌中強調只使用授權或公共領域的資料來訓練 Firefly,但公司從未公開明確表示 Firefly 部分訓練資料來自競爭對手的工具。不過,Adobe 在運行的兩個 Discord 討論組中提到了這些細節,這些討論組分別是 Adobe Stock 和專注於 Firefly 的討論組。