在 DevDay 2024 上,OpenAI 發佈了多項新開發工具,讓開發者能更輕鬆地打造進階 AI 應用。本次活動如預期並未推出新型號模型,不過 OpenAI 為開發者帶來四項重大公告。
創造 ChatGPT 進階語音模式的應用
首先,OpenAI 宣佈 Realtime API 公開測試版上線,讓開發者能在應用程式中建立低延遲、多模態體驗。開發者可藉此打造類似 ChatGPT 進階語音模式的應用,使用六種預設語音進行自然語音對話。對於不需要 Realtime API 低延遲優勢的開發者,OpenAI 也在 Chat Completions API 中加入音訊輸入和輸出功能。
Realtime API 的文字輸 入Tokens每 100 萬個收費 5 美元,輸出Tokens 則為每 100 萬個 20 美元。音訊輸入每 100 萬個Tokens收費 100 美元,輸出為每 100 萬個 Tokens 200 美元。換言之,音訊輸入每分鐘約 0.06 美元,輸出每分鐘約 0.24 美元。
GPT-4o 支援視覺微調
其次,OpenAI 宣佈 GPT-4o 支援視覺微調,讓開發者能同時使用圖像和文字微調型號。這在改進視覺搜尋功能、提升自動駕駛車輛物體偵測、精確醫學影像分析等場景中將發揮作用。視覺微調現已向所有使用最新 GPT-4o 型號快照「gpt-4o-2024-08-06」的付費開發者開放。
OpenAI 還提供每天 100 萬個免費訓練 Tokens,供開發者進行 GPT-4o 圖像微調,優惠期至 2024 年 10 月 31 日。此後,微調訓練每 100 萬個 Tokens 收費 25 美元,推理則為輸入每 100 萬個 Tokens 3.75 美元,輸出每 100 萬個 Tokens 15 美元。
Prompt Caching 降低成本提升效率
第三項公告是 OpenAI 推出 Prompt Caching 提示詞快取支援,讓開發者能降低成本並減少延遲。使用提示詞快取可節省 50% 費用,並縮短處理時間。開發者無需額外操作即可啟用此功能,它會自動應用於最新版本的 GPT-4o、GPT-4o mini、o1-preview 和 o1-mini,以及這些型號的微調版本。
型號蒸餾套件
最後,OpenAI 發佈新型號 Model Distillation suite,讓開發者能利用大型號輸出來微調小型號。這使他們能以更低成本在特定任務上達到先進型號的效能。過去, Model Distillation 涉及繁複流程和多個獨立工具。新型號 Model Distillation Suite 將整個 Model Distillation 流程整合至 OpenAI 平台。
Model Distillation 功能現已向所有開發者開放。OpenAI 提供每天 200 萬個 GPT-4o mini 免費訓練 Tokens 和 100 萬個 GPT-4o 免費訓練 Tokens,優惠期至 10 月 31 日。此後,蒸餾型號的訓練和使用費用與 OpenAI 現行標準微調價格相同。OpenAI 藉由簡化工作流程並降低成本,讓開發者更易於創新並突破 AI 應用界限。