Google 近日發佈了其新型號的人工智慧產品 Gemini,被視為對抗 ChatGPT 的重要一步。一段展示 Gemini 的影片吸引了廣泛關注,其中展示了一隻鴨子的即時繪製和分析過程,並以人聲進行互動。Google CEO Sundar Pichai 在 X 平台上分享此影片,強調 Gemini 的能力,並稱這是了解其能力的最佳方式。影片引起了廣泛的討論,許多人稱其為「令人難以置信」。
Google 員工:影片可能過分美化
然而,許多人迅速指出,Gemini 的實際運作並不像影片中展示的那樣完美。目前,Gemini 並不能實時發聲回應,其反應也不如影片中所示那般流暢。一些 Google 員工內部也對這些差異提出質疑。《彭博》引述一位 Google 員工的話指出,影片可能過分美化了使用 Gemini 獲得卓越結果的容易程度。
Google 對 Gemini 的定位與釋疑
Google 在一份聲明中表示,「Gemini 的展示影片是基於實際輸出製作的。」同時承認,為了演示的目的,減少了延遲,並縮短了 Gemini 的回應。Google 也向《彭博》確認,Gemini 的回應並未更改任何單詞,並且影片中的配音是根據實際文本提示錄製的。
Gemini 的實際能力
Google DeepMind 的產品副總裁 Eli Collins 對《彭博》表示,鴨子繪畫示範仍屬於研究階段,並非目前 Google 實際產品的一部分。
Gemini 於週三發佈,被視為 Google 努力追趕 OpenAI 的 ChatGPT 並重新確立其在人工智慧行業領先地位的成果。然而,這次的鴨子示範突出了 Google 的人工智慧技術的承諾與當前用戶體驗之間的差距。Google 表示 Gemini 是迄今為止最大、最有能力、最靈活的 AI 型號,超越了先前的 PaLM 2 型號。該公司聲稱,Gemini 在 32 項測試中超越了領先的 AI 型號,包括在 7 項測試中勝過 OpenAI 的 GPT-4。
Gemini 與 ChatGPT 的對比
目前,用戶可以在 Google 的免費聊天機器人 Bard 上體驗 Gemini 的中等版本。在有限的測試中,Bard 在某些任務上表現與 ChatGPT 3.5 相當,甚至在某些方面更好。但在某些任務上仍顯不穩定。
在測試中,Bard 在 7 個 SAT 數學和推理問題中正確回答了 4 個,但在一些規劃導向的任務上,Bard 的能力似乎有所提升。對於創造力測試,Bard 能夠寫出關於「OpenAI 董事局之亂」的歌詞。根據 DeepMind 的 Collins 的說法,Bard 現在可能是世界上最好的免費聊天機器人之一。