由 Elon Musk 創立的 xAI 再度升級其 AI 聊天機器人 Grok,推出全新 Voice Mode 功能,其中的 Grok Vision 將視覺辨識與語音對話結合,讓用戶能透過手機鏡頭與世界互動。此功能率先登上 iOS 平台,進一步挑戰 OpenAI 和 Google 的人工智能產品。

Grok 也能「看」世界
Grok Vision 是本次 Voice Mode 的核心亮點,用戶可用 iPhone 鏡頭指向任何物體並發問「我正在看什麼?」Grok 將即時給出具情境的語音回應,這代表 Grok 現在不僅能聽懂語音,也能解讀畫面內容。這項功能對日常場景應用如旅行導覽、即時翻譯或辨識物品具有相當潛力,雖然目前僅限於 iOS,Android 用戶仍需稍候。
Introducing Grok Vision, multilingual audio, and realtime search in Voice Mode. Available now.
— Ebby Amir (@ebbyamir) April 22, 2025
Grok habla español
Grok parle français
Grok Türkçe konuşuyor
グロクは日本語を話す
ग्रोक हिंदी बोलता है pic.twitter.com/lcaSyty2n5
即時搜尋更顯智慧
Voice Mode 同時加入多語音支援,用戶可與 Grok 使用多種語言對話,讓互動更具全球性。不僅如此,xAI 還整合了即時搜尋能力,Grok 能根據最新資訊做出即時回應,這對處理新聞、股市或時事查詢等情境尤為實用,也進一步縮短與 ChatGPT、Google Gemini 的技術差距。
記憶功能讓對話更貼近個人化需求
xAI 近期亦推出記憶功能,Grok 現可記住過去的對話內容與用戶偏好,從而提供更個人化的建議與回答。這讓 Grok 不再是單次對話的工具,而更像是了解你需求的智能助理,使用者體驗將因此更為順暢。
Studio 工作區開放創作流程更集中
除了對話升級,xAI 還發佈了全新工具 Studio,這是一個專為文件與程式碼產生設計的獨立工作空間,類似 ChatGPT 的 Canvas 功能。Studio 在獨立視窗中運作,讓用戶能專注於內容創作,是開發者與創作者的新利器。