Category: AI
-
AWS CEO 預測:未來 2 年內 AI 將大幅取代編寫程式碼工作
Amazon Web Services (AWS) 執行長 Matt Garman 近日表示,人工智能可能在未來 24 個月取代大部分的編程工作。這番言論引發業界廣泛討論,反映出科技巨頭對 AI 發展的看法。 開發者角色將轉變 根據《彭博》報導,Garman 在六月的一場爐邊談話中提到:「如果我們展望未來 24 個月或某個時間點 — 我無法準確預測具體時間 — 很可能大多數開發者將不再進行編碼工作。」 Garman 強調,開發者的技能不僅限於編碼,還包括創新和為終端用戶打造引人入勝的產品。他預測:「2025 年的開發者可能與 2020 年的大不相同。」 AI 對就業市場的衝擊 Garman 的言論正值 AI 對就業市場潛在影響成為熱門話題之際。然而,他對未來持樂觀態度,表示開發者將有更多創意機會,並指出 AWS 正協助員工「持續提升技能,學習新技術」,以提高他們運用 AI 的生產力。 研究顯示,37% 的公司已經使用 AI 技術取代員工,44% 預計 AI 將導致 2024 年裁員。這些數據突顯了 AI 對就業市場的日益增長影響,以及員工需要適應這一變化的迫切性。
-
一群作者控告 Anthropic 使用數十萬本盜版書訓練 Claude AI
一群作者對 Anthropic 提出訴訟,指控該公司使用盜版書籍訓練其 AI 模型。根據《路透社》報導,這項集體訴訟於週一在加州法院提出,聲稱 Anthropic「透過盜用數十萬本受版權保護的書籍,建立了一個價值數十億美元的企業」。 The Pile 數據集引發爭議 訴訟中,作者們表示 Anthropic 使用了一個名為「The Pile」的龐大開源數據集來訓練其 Claude AI 聊天機器人系列。這個數據集中包含稱為 Books3 的部分,是一個包含 Stephen King、Michael Pollan 等數千名作者作品的大規模盜版電子書庫。本月初,Anthropic 向《Vox》證實確實使用了 The Pile 來訓練 Claude。 作者要求停止使用受版權保護的內容 訴訟指出:「顯然 Anthropic 下載並複製了 The Pile 和 Books3,明知這些數據集包含了大量來自 Bibiliotik 等盜版網站的受版權保護內容。」作者們希望法院確認其集體訴訟的地位,並要求 Anthropic 支付擬議的損害賠償,同時禁止該公司在未來使用受版權保護的材料。 涉案作者及相關調查 提起訴訟的作者包括《We Were Never Here》的作者 Andrea Bartz、《The Good Nurse》的作者 Charles Graeber,以及《The Feather Thief》的作者 Kirk Wallace Johnson。雖然訴訟承認…
-
No-Code Programming 時代經已降臨
在科技快速發展的今天,人工智能(AI)工具正在徹底改變我們對編程的認知和實踐。從 Claude 這樣的 AI 助手到 Cursor 這樣的智能編碼工具,我們正在見證一場編程革命的來臨 —— No-Code Programming 時代的到來。 降低入門門檻 傳統上,編程需要學習複雜的語法和邏輯結構。但 AI 工具的幫助,即使是沒有編程背景的人也能夠創建功能強大的應用程序。例如,通過與 Claude 這樣的 AI 助手對話,用戶可以描述他們想要實現的功能,AI 就能生成相應的代碼。 提高開發效率 對於專業開發者來說,AI 工具極大地提高了 coding 效率。Cursor 等智能編碼工具可以自動補全代碼、提供實時建議,甚至生成整個功能模塊。這不僅加快了開發速度,還減少了許多常見的編程錯誤。 促進創新 當技術門檻降低,更多人能夠將想法轉化為現實,這無疑會激發更多的創新。AI 工具使得快速原型開發和迭代成為可能,讓創新者可以更快地驗證和完善自己的想法。 重新定義”編程” 隨著 AI 工具的普及,我們對”編程”的定義正在發生變化。編程不再僅僅是寫代碼,而是更多地關注於問題解決和系統設計。開發者的角色正在從”代碼編寫者”轉變為”AI 協作者”和”系統架構師”。 結語 No-Code Programming 時代的來臨,這不僅改變了軟件開發的方式,也為更廣泛的創新和問題解決開闢了新的可能性。在這個新時代,許多簡單到中階的項目變得更容易實現,例如網站和移動應用的前端開發、自動化工作流程等等,只要你能準確說出要求,透過 AI 工具就能實現。
-
全新 AI 基準測試工具問世!Geekbench AI 讓你精準評估裝置性能
Primate Labs 近日推出一款名為 Geekbench AI 的跨平台基準測試工具。這款工具是繼先前以 Geekbench ML 名義進行機器學習基準測試後的最新作品。 真實世界 AI 效能評測 Geekbench AI 是一款跨平台 AI 基準測試工具,透過真實世界的機器學習任務來評估 AI 工作負載效能。它會測量你裝置的 CPU、GPU 和 NPU,以判斷你的設備是否已為當前和未來尖端的機器學習應用做好準備。 創作者 John Poole 表示,Geekbench AI 能讓你洞悉開發者或硬體供應商在對特定裝置進行 AI 效能基準測試時所關注的面向,透過展示三個維度而非單一維度的效能來達成這一目標。他進一步解釋道,這正是他們所說的 Geekbench AI 旨在測量真實世界 AI 效能的部分原因:AI 是複雜、異質且變化快速的。透過這款基準測試工具,你可以探索不同硬體層級的方法如何針對特定任務進行優化。 多維度 AI 效能測試 該工具運行 10 種 AI 工作負載,每種都有 3 種不同的資料類型,為你提供多維度的裝置 AI 效能圖像。透過使用模仿真實世界 AI 使用案例的大型資料集,開發者和消費者都能在短短幾分鐘內測量裝置的 AI 效能,獲得單精度、半精度和量化分數。 全面硬體支援 Geekbench AI…
-
ChatGPT 免費版用戶可用 DALL-E 3 生成 AI 影像
OpenAI 宣布,ChatGPT 免費版用戶現在也能使用 DALL-E 3 模型生成 AI 影像。這項原本只提供給付費訂閱者的功能,現在擴展到所有使用者,不過每天僅限生成兩張圖片。 使用限制 OpenAI 在 X 平台上發佈了這項消息。他們表示,用戶可以要求 ChatGPT 為簡報製作圖片、為朋友製作個人化卡片,或者展示某個物品的樣貌。同時,該公司也提供了三個使用範例。 實用性存疑 雖然 ChatGPT 允許在不使用 DALL-E 3 模型的情況下修改圖片,例如上傳圖片後要求 ChatGPT 提供詳細描述,然後給予修改指示。但根據有限的實驗,效果似乎不太理想。 值得注意的是,AI 影像生成通常需要多次反覆調整才能達到理想效果。因此,每天僅限兩次嘗試的限制,可能會讓這項功能的實用性大打折扣。
-
美國司法部調查 Nvidia 壟斷市場行為
根據科技新聞網站 The Information 報導,美國司法部已對 Nvidia 展開調查,原因是競爭對手投訴該公司可能濫用其在人工智能晶片市場的主導地位。Nvidia 目前掌握約 80% 的人工智能晶片市場份額。 司法部關注 Nvidia 銷售策略 調查人員正在審視 Nvidia 是否向雲端服務供應商施壓,要求他們購買多種 Nvidia 產品。此外,調查還涉及 Nvidia 是否對有意從 AMD 和 Intel 等競爭對手購買人工智能晶片的客戶,收取更高的網路設備價格。 Nvidia 回應:遵守所有法律 Nvidia 未直接評論這項調查,但表示會提供監管機構所需的任何資訊。該公司發言人強調,Nvidia 的競爭優勢建立在數十年的投資和創新基礎上,並嚴格遵守所有法律。 團體和政界呼籲調查 美國進步團體和民主黨參議員 Elizabeth Warren 曾敦促司法部調查 Nvidia 的競爭行為。這些團體批評 Nvidia 將軟體和硬體捆綁銷售的做法,而法國反壟斷執法機構也正準備就此提出指控。 業界關注調查結果 隨著人工智能技術的快速發展,Nvidia 在市場中的主導地位引發了競爭關注。此次調查的結果可能會對人工智能晶片市場的競爭格局產生重大影響。業界將密切關注事態發展,以及可能帶來的監管變化。
-
AI 破解電磁輻射 你的 HDMI 線可能正在洩露螢幕秘密
烏拉圭研究人員最近揭露了一項令人擔憂的發現:駭客可能利用人工智能技術,通過攔截電腦與螢幕之間傳輸線所洩漏的電磁輻射,竊取顯示器上的資訊。研究團隊表示,這類攻擊很可能已經在發生,但一般家庭電腦用戶無需過度擔心。 多種攻擊方式 HDMI 線成目標 這種攻擊可以透過多種方法實現,其中包括在建築物外部放置天線來攔截 HDMI 線纜發出的信號。烏拉圭共和國大學的 Federico Larroca 表示,他的團隊已開發出一種人工智能模型,能夠在幾米外重建洩漏信號中的數位信號。 NSA 與北約早有防範 美國國家安全局(NSA)和北約將這類攻擊稱為 TEMPEST 攻擊。NSA 的 TEMPEST 標準要求採取保護措施,以防止駭客可能攔截和解讀的電磁輻射。 利用類似 Larroca 團隊開發的方法,駭客可能會在用戶輸入加密訊息、銀行登入資訊或其他個人資料時窺探螢幕。研究團隊指出,駭客甚至可以站在建築物外面用天線攔截信號,或植入一個小型裝置來捕獲信號,然後傳輸數據或親自取回。 AI 模型提高準確度 研究人員使用一組匹配的原始信號和攔截信號來訓練 AI 模型。在測試中,竊聽過程大約誤解了 30% 的字符。團隊表示,這個錯誤率已經足夠低,人類仍然可以準確閱讀大部分文本。 政府機構應提高警惕 Larroca 認為,這類攻擊很可能已經發生,但僅限於高度敏感的工業或政府環境中。在這些情況下,整棟建築物通常都有電磁信號屏蔽,以防止此類安全漏洞。Larroca 表示:「政府對此很擔心,但我不認為普通用戶應該過於擔心。不過,如果你真的很在意自己的安全,無論出於什麼原因,這可能會成為一個問題。」
-
Canva 收購 Leonardo.ai 擴充人工智能領域
Canva 宣佈計劃收購澳洲生成式人工智能內容和研究新創公司 Leonardo.ai,藉此建立「世界級的視覺人工智能工具套件」。雖然交易金額尚未公開,但此舉將讓 Canva 獲得 Leonardo.ai 的一系列可自訂文字轉圖像和文字轉影片生成器。 延續獨立發展整合現有服務 Canva 聯合創辦人 Cameron Adams 表示,Leonardo.ai 將「繼續開發其網路平台」作為獨立產品,類似 Canva 3 月收購的 Affinity 創意軟體套件。Leonardo.ai 的技術和 Phoenix 基礎模型也將「迅速」整合到 Canva 現有的 Magic Studio 產品系列中,如 Magic Media 圖像和影片生成器。 強化競爭力挑戰 Adobe 地位 Canva 近期致力於使其平台多樣化,增加更多類似辦公套件的工具,但該視覺設計和通訊平台仍是 Adobe 創意軟體產品系列最大的競爭對手之一。Affinity 的收購可能有助於 Canva 與 Adobe 的 Illustrator、Photoshop 和 InDesign 等軟體競爭,而 Leonardo.ai 則可能成為 Adobe Firefly 生成式人工智能模型的替代方案。 模型訓練資料引關注 Leonardo.ai 向《TechCrunch》表示,其模型使用「經授權、合成和公開/開源資料」進行訓練,這比 Adobe…
-
OpenAI 開始向 ChatGPT Plus 用戶發佈 Advanced Voice Mode
OpenAI 正在逐步向部分 ChatGPT Plus 用戶推出進階語音模式。該公司今日在 X 平台上公告了此事。進階語音模式帶來了更自然、即時的對話體驗,使用戶可以隨時打斷,並能夠感知及響應用戶的情感。參與本次測試的用戶將會收到電子郵件和手機應用程式中的通知,告訴他們如何使用此功能。OpenAI 將會持續招募更多的參與者,並計劃在秋季使所有 Plus 用戶均可使用此功能。之前提到的視頻和屏幕共享功能將在稍後時候推出。 OpenAI 在五月的活動中首次展示了這個功能,但因為安全問題及 Scarlett Johansson 的投訴而延遲推出,後者聲稱該語音聽起來像她的聲音。該公司表示,已經建立了系統以增強安全性,防止模型使用四個以外的預設聲音。自首次展示進階語音模式以來,OpenAI 一直在努力提升語音對話的安全性及質量,為將這項尖端技術帶給數百萬人做好準備。該公司與 100 多名外部測試者一同在 45 種語言中測試了 GPT-4o 的語音能力。為了保障用戶的隱私,模型僅被訓練為使用四個預設聲音,並且建立了系統以阻止其他不同的聲音輸出。此外,OpenAI 還實施了防護措施,防止對暴力或版權內容的請求。關於 GPT-4o 的能力、限制及安全評估的詳細報告將於八月初公布。 值得一提的是,Apple 已經與 OpenAI 進行合作,將 ChatGPT 整合進 iOS 18、iPadOS 18 和 macOS Sequoia 的用戶體驗中。 %media_content% %media_thumbnail%
-
X 自動收集用戶資料訓練 Grok AI 引爭議
社交平台 X(前身為 Twitter)近期加入人工智能大軍,推出基於大型語言模型的對話機器人 Grok。然而,X 最近採取了一項爭議性做法:自動將用戶資料納入 AI 訓練範圍,引發各方關注。 用戶意外發現被納入 AI 訓練 這項變更最初是由驚訝的用戶們發現。然而,不僅用戶對此毫無準備,連歐洲監管機構也表示事先並未獲得通知。 如何選擇退出資料收集 若不願參與資料收集,用戶可透過桌面瀏覽器輕鬆退出。目前手機應用程式尚未顯示相關設定。具體步驟如下: 歐盟監管機構要求 X 解釋 此舉不僅可能降低部分用戶的信任,還可能使 X 陷入麻煩。自動加入機制可能違反保護歐洲公民隱私的 GDPR 法規。 愛爾蘭資料保護委員會(DPC)負責監督 X 是否遵守歐盟 GDPR,該機構表示對 X 的決定感到意外。DPC 正積極與 X 溝通此事,預計下週初將收到 X 的解釋。 先例與潛在後果 此前,Meta 曾試圖收集歐洲用戶的公開內容,但在歐盟當局介入後放棄。相較之下,Meta 雖計劃自動將用戶納入,但事先通知用戶並提供退出選項。然而,歐盟對此仍不滿意,對 X 目前的做法恐怕更難以接受。
-
Google Gemini 升級至 1.5 Flash 回應速度更快免費版本今日起可用
Google 宣布將其 Gemini AI 聊天機器人升級至 Gemini 1.5 Flash ,讓用戶體驗更快的回應速度,並能處理更多內容。 提升品質反應更快 Gemini 工程副總裁 Amar Subramanya 在網誌中表示,升級至 1.5 Flash 後,用戶將看到「品質和延遲的全面改善,尤其在推理和圖像理解方面有明顯進步」。此外,Gemini 的上下文視窗(AI 型號一次可處理的文字塊數量)也將增加四倍,達到 32K tokens。 免費版本今日起可用 Subramanya 指出,1.5 Flash 於 5 月的 Google I/O 大會上發表,從今天開始,網頁版和移動版的 Gemini 免費版本都將可以使用。 新增相關內容連結功能 為協助用戶查找研究主題的事實資訊,Google 將在 Gemini 的「事實查詢提示」中顯示相關內容的連結。用戶只需點擊段落末尾的灰色箭頭即可查看這些連結。 其他改進 Google 還宣布將在歐洲經濟區、英國和瑞士的 Google Messages 中「逐步」推出 Gemini。此外,面向青少年的 Gemini 版本將在未來一週內支援超過 40 種語言。這些更新顯示 Google 正持續改進其 AI 服務,以提供更快速、更全面的用戶體驗。隨著 AI…
-
OpenAI 推出 AI 搜尋引擎 SearchGPT 挑戰 Google 地位
OpenAI 正式宣佈進軍搜尋市場,推出備受期待的 AI 驅動搜尋引擎 SearchGPT。這款搜尋引擎能夠即時存取網際網路上的資訊,為用戶提供全新的搜尋體驗。 新定義搜尋方式 SearchGPT 的首頁呈現一個大型文字方塊,詢問用戶「你在尋找什麼?」有別於傳統搜尋引擎僅列出連結清單,SearchGPT 致力於組織並理解搜尋結果。OpenAI 提供的範例顯示,搜尋引擎能夠總結音樂節相關資訊,並附上簡短的活動描述和來源連結。另一個例子則是解釋種植番茄的時機,並介紹不同品種的特性。 搜尋結果出現後,用戶可以提出後續問題或點擊側邊欄開啟相關連結。SearchGPT 還具備「視覺答案」功能,但 OpenAI 尚未詳細說明其運作方式。 測試階段:限量用戶體驗 OpenAI 發言人 Kayla Wood 表示,SearchGPT 目前仍處於「原型」階段,由 GPT-4 系列模型驅動。初期僅開放 10,000 名測試用戶使用。Wood 補充,OpenAI 正與第三方合作夥伴合作,並使用直接內容輸入來建立搜尋結果。未來計劃將搜尋功能直接整合到 ChatGPT 中。 挑戰 Google 霸主地位 SearchGPT 的推出可能對 Google 構成重大威脅。Google 已迅速在其搜尋引擎中加入 AI 功能,以防用戶轉向率先提供這些工具的競爭對手。此舉也使 OpenAI 與自稱為 AI「答案」引擎的新創公司 Perplexity 展開更直接的競爭。 與多家新聞機構合作 OpenAI 似乎注意到了 Perplexity 因 AI 摘要功能而遭到出版商批評的問題,並採取了明顯不同的方法。該公司強調,SearchGPT 是與多家新聞機構共同開發的,包括《華爾街日報》、《美聯社》和 Vox Media 等機構。OpenAI…
-
Adobe 為 Photoshop 及 Illustrator 推出 AI 新功能
Adobe 宣佈對 Illustrator 的生成式 AI 功能進行重大更新,設計師應該會對此感到欣喜。這次更新的主要亮點是 Generative Shape Fill,該功能能夠通過文字添加向量到圖形中。 Generative Shape Fill 提升設計效率 在針對媒體的簡報中,Adobe 示範了這一功能,使用「可愛的 3D 機器人」作為提示,將一些基本圖形填充了向量細節。這個功能甚至允許你設置圖形強度、細節水平、顏色和色調,以及樣式參考。與 Photoshop 中的生成填充不同,這些基於向量的 AI 功能都可以進行編輯。 Adobe 還進一步推出了 Text to Pattern 功能,同樣使用文字提示,如「海軍藍上的花卉和動物」,即可快速將圖形填充為無縫向量圖案。 Retype 讓字體設計更輕鬆 此外,Retype 功能也被推出,這對於經常處理字體和文本的設計師來說是一個巨大的時間節省。Retype 可以從 JPEG 圖像中創建向量字體,並將其匹配到庫中已有的相似字體。它甚至能自動填充你從圖像中提取文字的背景。 Mock-Up 和 Dimension Tool 帶來新功能 這些功能仍處於測試階段,基於 Firefly Vector 2 模型,該模型是去年推出的原始模型的更新版。除了生成式 AI 功能外,這次更新還引入了一些新的非生成式 AI 功能,這些功能可能對專業設計師更有用。 其中一個最實用的功能是 Mock-Up,它可以自動將圖形和標誌映射到現實物體上。想看看標誌在咖啡杯上的樣子嗎?這從未如此簡單。Mock-Up 可以理解深度,將你的圖形圍繞圖像中的任何形狀進行捲曲。該功能可在 Object > Mock-Up 下找到。一旦創建,你甚至可以訪問面板中的一些預加載對象示例,如襯衫或帽子。…
-
OpenAI 發佈輕量型 GPT-4o Mini 免費版 ChatGPT 也可用
OpenAI 最近推出了一款針對開發者的輕量型模型 GPT-4o Mini,不僅價格比全尺寸模型便宜許多,功能也比 GPT-3.5 更加強大。 降低開發成本 目前使用 OpenAI 模型開發應用程式,往往會累積高昂費用,許多開發者因無法承受高成本而被迫選擇 Google 的 Gemini 1.5 Flash 或 Anthropic 的 Claude 3 Haiku 等較便宜的替代方案。為了回應這個市場需求,OpenAI 也加入了輕量型模型的競賽。 取代 GPT-3.5 免費使用 自今天起,ChatGPT 的 Free、Plus 和 Team 計劃用戶都可以使用 GPT-4o Mini 取代 GPT-3.5 Turbo,企業用戶則會在下週獲得使用權限。這意味著 GPT-3.5 將不再是 ChatGPT 用戶的選項,但開發者仍可以通過 API 使用這個模型,直到它最終退役。OpenAI 的 Godement 表示,尚未確定 GPT-3.5 何時會從 API 退役。 多模態支援 新的輕量型模型將在 API 中支援文字和影像,未來還將處理包括影片和音訊在內的所有多模態輸入和輸出。這將使得虛擬助理更加智能,可以理解你的行程安排並提供建議。儘管如此,這款模型主要針對簡單任務設計,不適用於打造高階的 Siri…
-
Anthropic 發佈 Claude 3.5 Sonnet
Anthropic 公佈最新的 AI 聊天機器人 Claude 3.5 Sonnet,這是該公司更新後的首個語言模型,據稱該模型更幽默、更擅長寫作,且在軟體工程方面也更為精通。iOS 版本已於六月底率先上線,Android 應用程式也於本週推出。 未來推出更多型號 Anthropic 表示,另有兩個型號 Claude 3.5 Haiku 和 Claude 3.5 Opus 將在今年晚些時候發佈。儘管未具體說明時間框架,該公司在六月的一篇網誌中提到:「我們的目標是每隔幾個月就能顯著改善智能、速度和成本之間的權衡曲線。」 性能優於前型號 Claude 3.5 Sonnet 的表現超過了三月份推出的高端型號 Claude 3 Opus。當時,Anthropic 曾自豪地表示,這些早期型號展現出「類似人類的理解力」。也有測試者表示 Claude 是「聊天性最強的 AI 聊天機器人」,並指「它以易於理解的類人類語言回答問題,這使其成為大多數人最理想的 AI 聊天機器人。」 生成式 AI 競爭激烈 目前正處於生成式 AI 的黃金時期,各科技公司推出越來越強大的語言模型和功能強大的聊天機器人。在這場競賽中,有很多利害關係。隨著我們在家庭和工作中整合這項技術,現在能夠吸引忠實受眾的工具將確保持久的相關性。這是一場持續的比拼。AI 巨頭和 ChatGPT 製造商 OpenAI 在五月宣佈了其最新的旗艦型號 GPT-4o。次日,Google 在其 Google I/O 開發者大會上推出了其 Gemini 1.5 Pro 型號。幾週後的六月,Apple…
-
IEEE 評估 AI 寫程式的能力 簡單問題成功率達 89% 困難問題僅 0.66%
研究指出,程式設計師經歷了數十年撰寫人工智能(AI)模型的程式碼,現在 AI 正在進行一個圓滿的循環,開始自己寫程式碼。然而,AI 程式碼生成器能否與人類程式設計師媲美呢? ChatGPT 寫程式能力評估 《IEEE Transactions on Software Engineering》六月期刊發佈的一項研究評估了 OpenAI 的 ChatGPT 所生成程式碼的功能性、複雜度和安全性。研究結果顯示,ChatGPT 在生成功能性程式碼方面,成功率範圍廣泛,從低至 0.66% 到高達 89%,取決於任務的難度、程式語言及其他多種因素。 AI 生成程式碼的優勢與挑戰 格拉斯哥大學講師 Yutian Tang 表示,基於 AI 的程式碼生成可以提升生產力並自動化軟體開發任務,但需了解這些模型的優勢與局限。通過全面分析,可以發現 ChatGPT 程式碼生成中可能出現的問題和局限,從而改進生成技術。 ChatGPT 的測試與表現 Tang 的團隊測試了 GPT-3.5 在五種程式語言(C、C++、Java、JavaScript、Python)中處理 728 個 LeetCode 測試平台上的程式問題的能力。ChatGPT 在解決不同語言的問題時表現尚佳,尤其在處理 2021 年前的 LeetCode 問題時,成功率較高。具體來說,簡單、中等和困難問題的成功率分別約為 89%、71% 和 40%。 然而,對於 2021 年後的算法問題,ChatGPT 生成功能性正確程式碼的能力下降。例如,簡單問題的成功率從 89% 下降到 52%,困難問題的成功率從 40%…
-
隱藏了一年的秘密:OpenAI 遭駭客入侵 部分敏感信息外洩
據《紐約時報》報導,去年初,OpenAI 的內部通訊系統遭到駭客入侵,竊取了公司技術運作的部分細節。雖然駭客未能進入存放關鍵 AI 技術的系統,但這次事件仍引發了公司內部的重大安全隱憂,甚至引起了美國國家安全方面的擔憂。 部分敏感信息被暴露 這次入侵事件發生在員工討論 OpenAI 最新技術的線上論壇。雖然 OpenAI 存放訓練數據、算法、結果和客戶數據的系統未受影響,但仍有部分敏感信息被暴露。2023年4月,OpenAI 高層向員工和董事會披露了這一事件,但未公開此事,理由是未有客戶或合作夥伴數據被竊,且駭客可能僅為個人行為,無政府背景。然而,這一決定並未得到所有人認同。 內部批評與人事變動 OpenAI 的技術項目經理 Leopold Aschenbrenner 批評公司的安全措施不足,無法有效防止外國對手取得敏感信息。隨後,他因洩漏信息而被解僱,他聲稱這一舉措具有政治動機。對此,OpenAI 表示,Aschenbrenner 的解僱與其對安全的擔憂無關,並強調對其貢獻的肯定,但不同意其對安全措施的評價。 國家安全與外部風險 此次事件加劇了對外國對手,特別是中國可能參與的擔憂。儘管 OpenAI 認為其現有的 AI 技術不構成重大國家安全威脅,但洩露給其他國家的專家,可能會加速他們的 AI 技術進步。為應對這一安全漏洞,OpenAI 已加強其安全措施,例如增設防護措施以防止 AI 應用被濫用,並成立由前 NSA 主任 Paul Nakasone 參與的安全委員會,以應對未來風險。
-
macOS 版 ChatGPT 對話以純文本形式保存?隱私問題浮現!
OpenAI 最近發佈了官方的 macOS 版 ChatGPT 應用程式,這也是首個針對桌面平台的 ChatGPT 應用程式。儘管這款應用讓與聊天機器人的互動更加便捷,但部分用戶對其隱私問題表示擔憂。這是因為應用程式將所有對話以純文本形式存儲,可能會暴露用戶的敏感數據。 對話以純文本形式保存 開發者 Pedro Vieito 在 Threads 中指出,官方的 Mac 版 ChatGPT 應用程式並未使用 macOS 的標準沙盒系統。透過查看應用程式存儲的偏好設定和緩存文件,Vieito 發現所有在應用程式中登記的對話都以純文本形式保存,任何人都可以輕易訪問這些數據。 什麼是沙盒? 對於不熟悉的人來說,「沙盒」是一種安全控制系統,基本上是在一個隔離的環境中運行應用程式及其所有數據。這樣,應用程式不能在未獲得許可的情況下訪問系統的其他部分,其他應用程式也不容易讀取來自沙盒應用程式的數據。 在 iOS 上,所有第三方應用程式都在沙盒中運行。但在 Mac 上,這個系統是在 2011 年 OS X Lion 推出後才實施的。多年後,隨著 macOS Mojave 的推出,Apple 增加了新的安全層,應用程式在訪問沙盒之外的數據時需要徵得用戶的許可。 然而,儘管在沙盒中運行應用程式可以提高安全性,但這個系統在 macOS 上仍然是可選的,因為一些更複雜的應用程式需要完整的磁碟訪問權限。有許多 macOS 應用程式並未沙盒化。但當涉及處理敏感數據的聊天應用程式時,大多數都採用了沙盒技術。 用戶應該注意什麼? 對於使用 macOS 版 ChatGPT 的用戶來說,應該注意到這些對話數據可能會被第三方輕易訪問。如果用戶擔心數據隱私,可以考慮採取額外的安全措施,比如定期清除應用程式的緩存文件,或使用其他安全性更高的聊天工具。
-
聯合國:中國在人工智能發明數量領先全球
根據聯合國最新數據,中國在開發人工智能產品方面取得顯著領先地位。聯合國世界知識產權組織(WIPO)於 7 月 3 日發佈的報告《WIPO Patent Landscape Report on Generative AI》指出,從 2014 年至去年,中國共提出超過 38,000 項生成型人工智能發明,是排名第二的美國的六倍。 中國發明數量領先 WIPO 表示,透過分析專利趨勢和數據,希望能讓大家更好地了解這項快速發展的技術在哪裡被開發,以及它的未來走向。WIPO 總幹事鄧鴻森指出,這將有助於政策制定者塑造生成型人工智能的發展,確保人類仍然是創新和創意生態系統的中心。 生成型人工智能專利增長迅速 自 2017 年引入支撐當今大型語言模型的深度神經網絡架構以來,生成型人工智能專利數量激增八倍。報告顯示,去年發佈的生成型人工智能專利佔全球所有人工智能專利的 6%,其中超過四分之一是在去年發佈的。 主要專利申請者來自中國 在前十大生成型人工智能專利申請者中,有六家來自中國,前四名分別是騰訊、平安保險、百度和中國科學院,這些公司超越了美國的科技巨頭如 IBM、Google 和 Microsoft。 Anthropic 推出 AI 能力與風險評估計劃 另一方面,Anthropic 本週宣布了一項新資金計劃,旨在支持第三方機構開發評估人工智能能力和風險的新方法,以解決這個不斷發展領域中的一個重要缺口。 評估方法影響深遠 根據《PYMNTS》於 7 月 2 日的報導,Anthropic 的計劃可能對商業人工智能領域產生深遠影響。通過創建更可靠和全面的評估方法,企業或許能夠有信心在醫療、金融和客戶服務等關鍵領域部署人工智能解決方案,這可能會解鎖生產力的提升和新的收入來源。 評估質量關鍵 然而,報導補充指出,該計劃的成功主要取決於所開發的評估方法的質量和相關性。如果新基準無法充分捕捉現實場景,或者過於狹隘,可能會提供一種錯誤的安全感。
-
創科局:政府已開發「公務員文書輔助系統」取代 ChatGPT
早前,香港政府針對資訊保安風險,表明無計劃在政府內部使用 ChatGPT。創新科技及工業局局長孫東在接受《無線新聞》專訪時透露,政府已經研發出一個「替代品」,並於今年初開始進行「訓練」,目前進展良好。 孫東指出,這個大模型參照 OpenAI 的 ChatGPT 水準,但屬於「香港版」,名為「公務員文書輔助系統」。這個系統已在創新科技局內部開始試用,並計劃在條件允許時,推廣至政府各部門進行試用。
-
OpenAI 加強封鎖措施 下月禁中國及香港開發者使用其 API
中國《證券時報》報導,OpenAI 計劃限制其 API 在中國大陸使用權限。自週一晚間以來,中國的 API 平台用戶收到了警告郵件,通知他們所處地區是 OpenAI 目前不支持的地區,並將從 7 月 9 日起採取額外措施封鎖某些地區的 API 流量。儘管 ChatGPT 並未在中國大陸提供服務,但許多中國初創企業透過 OpenAI 的 API 平台開發自己的應用。 南華早報:香港也受影響 《南華早報》 指今次 OpenAI 加強封鎖來自「不支持國家和地區」的訪問,包括中國大陸及香港。雖然 OpenAI 的 AI 服務已經在超過 160 個國家推出,但在中國大陸及香港仍未正式開放。當地用戶必須依賴虛擬私人網絡(VPN)或第三方應用來訪問 ChatGPT,而開發者則需要使用代理和外部伺服器來繞過限制。 百度推優勢搶客 作為回應,百度宣布推出「故鄉的雲·國產大模型普惠計劃」,為新用戶免費提供遷移至其「文心一言」平台的服務。百度雲部門表示,將為 OpenAI 用戶提供額外的 Ernie 3.5 旗艦模型代幣,匹配他們在 OpenAI 上的使用規模。 阿里雲加入競爭 阿里雲也參與其中,通過其 AI 平台為 OpenAI API 用戶提供免費代幣和遷移服務。據阿里巴巴稱,其 Qwen-plus 模型的定價遠低於 GPT-4。
-
AI 技術出錯成笑柄 麥當勞宣佈取消 AI 點餐功能
近日,美國網民分享透過麥當勞 AI 系統點餐,出現很多令人難以置信的錯誤,因此麥當勞決定在美國的 Drive-through 車道服務中移除 AI 點餐技術。 IBM 技術試驗始於 2019 該系統由 IBM 開發,利用語音識別軟件來處理訂單。2019年宣布進行試驗,然而並未完全可靠,在網上流傳出現如「培根雪糕」這些不應出現的食品,甚至數百美元的麥樂雞訂單。 訂單錯誤成網路笑柄 麥當勞通知特許經營商,將在七月底前從超過100家測試餐廳中移除此技術。據《Restaurant Business》報導,該餐廳連鎖表示,經過審慎審查,決定今年結束與 IBM 在自動點餐技術 (AOT) 上的全球合作。 麥當勞未放棄 AI 技術 然而,麥當勞仍對 AI 技術的未來應用充滿信心,表示將繼續評估長期可擴展的解決方案,並在年底前就未來的 AI 語音點餐解決方案做出明智決定。 網路影片揭露 AI 點餐系統漏洞 AI 點餐系統的失誤在網上備受關注。一個受歡迎的影片顯示,兩人因訂單中被添加了數百美元的雞塊而大笑,而《New York Post》報導有人因技術錯誤在雪糕中添加了培根。
-
將照片變電影級短片 Luma Dream Machine 免費使用教學
影片生成服務 Luma Dream Machine 是近期很多人在試玩的新 AI 玩意,你只需要上載一張照片,它便能生成出短片,而且效果非常出色。 Dream Machine 模型 Dream Machine 是一個能夠快速從文字和圖像生成高品質現實影片的 AI 模型。這是一個高可擴展且高效的 Transformer 模型,直接訓練於影片,使其能夠生成物理準確、一致且具事件性的鏡頭。Dream Machine 被視為構建通用想像引擎的第一步,現在已向所有人開放使用。 影片生成速度驚人 Dream Machine 影片生成速度極快,能在 120 秒內生成 120 幅畫面。使用者能更快地進行迭代,探索更多的創意,並擁有更大的夢想。 照片變 5 秒短片 Dream Machine 能生成 5 秒的影片鏡頭,並且具有平滑的運動、電影攝影效果和戲劇性。這個模型可以使靜止的圖像變得生動,將快照轉變為故事。 理解人物、動物與物體的交互作用 Dream Machine 能夠理解人、動物和物體如何與物理世界交互,這使得生成的影片具有極高的角色一致性和準確的物理效果。 電影運鏡效果出色 Dream Machine 幫助使用者實驗無限的流暢、電影感和自然的攝影機運動,並能夠與場景的情感和內容相匹配。這樣的功能讓影片生成過程更加生動有趣,充滿創造力。 Luma Dream Machine 使用教學 1:先登入 Luma Dream Machine 網站,用戶可用 Google Account 進行登入。…
-
蘋果:2020 年 Mac 就有 Neural Engine 不像其他公司近期才出 AI PC
在 WWDC 2024 後,Apple 的高層包括 Craig Federighi、Greg Joswiak 和 John Giannandrea 展開了一系列訪談,討論了 iOS 18、Apple Intelligence 等話題。以下為這些訪談的綜合整理。 Apple 回應 AI 競爭批評 在年度 The Talk Show Live 訪談中,Federighi 談到外界認為 Apple 在 AI 方面落後的說法,並指出自 2020 年起,Apple 就在 Mac 中搭載 Neural Engine,只是不像其他公司那樣將其品牌化為 “AI PC”。 Federighi 表示,AI PC 這個概念最近才被提出,好像有人今年才發現 Neural Engine 的存在。然而,Apple 早在多年前就已經在手機中使用這項技術,並於 2020 年推出首款搭載 Neural Engine 的 M1 Mac…
-
ChatGPT 整合 iOS 18 據稱蘋果並不需要向 OpenAI 付費
在本週一舉行的 WWDC 大會上,Apple 宣佈了備受期待的合作計劃,將與 OpenAI 合作,把 ChatGPT 引入 iOS 18。儘管 Apple 和 OpenAI 對於協議細節保持沉默,但《彭博》的一篇新報導揭示了一些幕後情況。根據報導顯示,Apple 並未支付 OpenAI 任何費用。 合作細節曝光 Mark Gurman 指出,Apple 與 OpenAI 的合作「在初期不會為任何一方帶來實質性的收入」。因此,Apple 不會支付 OpenAI,反之亦然。 事實上,Apple 認為 iOS 18 的整合給 OpenAI 帶來的曝光度「等同或高於現金價值」:這項安排包括將 ChatGPT,這款能夠以簡單術語回答信息請求的數字助理,融入 Apple 的 Siri 和新的寫作工具中。據知情人士透露,Apple 並未支付 OpenAI 合作費用,而是認為將 OpenAI 的品牌和技術推廣至數億台設備的價值,等同或高於現金支付。 未來展望 《彭博》表示,Apple 的目標是與人工智能公司達成收入分成協議。根據這類安排,Apple 將從在其平台上實現變現的 AI 夥伴那裡獲得「分成」。 在 iOS 18、iPadOS 18 和 macOS…
-
Apple Intelligence 初期只支援英語 何時才能支援中文?
相信 WWDC 24 最多人關心的就是蘋果 AI 功能 Apple Intelligence,它不但令 iPhone、iPad、Mac 變得更方便,而且 Siri 也大幅增強,能夠更明白用戶所想。不過何時才能用? 根據蘋果的官方資料顯示,Apple Intelligence 將在今年秋季隨 iOS 18、iPadOS 18 和 macOS Sequoia 推出,並首先在美國英語版本中提供測試版。那就是說,今年 9 月的 Apple Intelligence 只限英語,不會懂得講及聽中文。 另外,Apple Intelligence 的所有功能並不是立即全部開放,蘋果表示一些功能、軟件平台和其他語言將在未來一年內逐步推出。那就是說,英語以外的語言支援很可能要待明年才有。 此外,你的 iPhone 必須要使用A17 Pro 或以上,那就是 iPhone 15 Pro/ iPhone 15 Pro Max 或以上。
-
蘋果整合 ChatGPT 馬斯克揚言禁用 Apple 設備
Apple 在 WWDC 宣佈,將在 iPhone、iPad 及 Mac 整合 OpenAI 的技術,讓用戶在與 Siri 對話時,可以將部分查詢交由 OpenAI 的大型語言模型 ChatGPT 處理。對此,Elon Musk 表示,這樣的更新將構成「不可接受的安全漏洞」。 馬斯克警告禁用 Apple 設備 馬斯克在他所擁有的社交平台 X 上發文表示:「如果 Apple 在操作系統層級整合 OpenAI,那麼 Apple 設備將在我的公司內被禁用。這是一個不可接受的安全漏洞。」 此外,他補充說:「訪客將不得不在門口檢查他們的 Apple 設備,這些設備將被存放在法拉第籠中。」法拉第籠是一種阻止無線信號進出封閉盒子。 禁令可能影響 SpaceX 和 Tesla 馬斯克的禁令預計將影響 SpaceX 和 Tesla,以及 X 平台。Apple 早前表示,這項功能將在今年晚些時候推出。OpenAI 也確認其技術將廣泛整合到操作系統中。 強調隱私保護 Apple 和 OpenAI 強調,該功能將包括隱私保護措施。OpenAI 在宣佈中表示:「查詢請求不會被存儲,用戶的 IP 地址將被隱藏。」這次整合意味著 Siri 的請求可以交由 ChatGPT…
-
郭明錤:iOS 18 AI 功能對換機需求幫助有限
知名蘋果分析員郭明錤發表最新報告,他指市場普遍期待 Apple 能重新定義裝置端 AI 的使用者行為,並帶動硬體換機潮。Apple 股價在過去數週持續上漲,顯示市場對 WWDC 2024 持正向態度。 AI 服務是否能推動硬體成長? 關於 AI 服務是否能推動 Apple 的硬體產品出貨重返成長,郭明錤指出關鍵在於 AI 服務是否具備「獨特且可持續的競爭優勢」。以 OpenAI 推出的 macOS 桌面端 ChatGPT 為例,功能與網頁端幾乎相同,優勢不可持續,對 Apple 硬體出貨成長無幫助。 iOS 18 的 AI 功能影響有限 郭明錤根據供應鏈調查指出,2024 年下半年 iPhone 16 出貨量將同比下降約 5%。這意味著 Apple 目前認為 iOS 18 的 AI 功能對換機需求幫助有限。 AI 服務能否推動 Apple 的服務業務? 郭明錤指出,裝置端 AI 難以對用戶收費,而雲端 AI 或雲端與裝置端整合的 AI 更有機會相比…
-
ChatGPT 語音助手聲音太像「黑寡婦」 OpenAI 宣佈停用
早前,OpenAI 宣佈推出 GPT-4o,而 ChatGPT 隨後的語音助手也大幅增強,不過近日一些用戶發現當中一款名為 Sky 的語音助手,其聲音實在太像 Marvel 角色「黑寡婦」Scarlett Johansson,引來很多的關注,而 OpenAI 決定將 Sky 停用。OpenAI 模型行為負責人 Joanne Jang 表示,公司已與 Scarlett Johansson 的代表進行了溝通,表示理解他們的關切,並希望認真聽取反饋。 去年 9 月獲邀請配音 Scarlett Johansson 亦發表聲明,指出去年九月曾收到 OpenAI 執行長 Sam Altman 的邀請,請她為 ChatGPT 4.0 系統配音,但她基於個人原因婉拒了這個提議。然而,九個月後,她的朋友、家人及公眾皆注意到 ChatGPT 的新聲音「Sky」與她在電影《Her》中扮演的智能語音助理非常相似。OpenAI 及 Altman 否認 Sky 聲音來自約翰遜,並向她表示歉意,承認在溝通上存在不足。 OpenAI:相似只因女性語音助理太少 OpenAI 的 CTO Mira Murati 在接受《The Verge》訪問時表示,公司無意模仿 Scarlett Johansson 在電影《Her》中的聲音。Jang 認為,人們會感到相似是因為現有的女性語音助理範例太少。相比之下,Siri 和…
-
ChatGPT 語音聊天功能廣東話實試 驚變「譚仔」音!
OpenAI 日常宣佈推出 GPT-4o 模型,而近日它已分批開放給用家試用其 ChatGPT App 的語音聊天功能。筆者立即試用,它能夠支援中文,國語、普通話的表現不錯,然而廣東話卻出現奇怪的「變音」,這顯然是「譚仔」音而不是香港的廣東話音。 事實上,ChatGPT 在語言上已有很強的突破,官方作翻譯,效果極為出色。相信日後會有很大的進步空間。
-
OpenAI 大幅提升 ChatGPT 資料分析功能 支援 Google Drive
OpenAI 宣佈進行了一次重要更新,旨在強化 ChatGPT 的資料分析能力。該公司表示,這些改進將簡化處理資料集的流程,為用戶提供更具互動性的工具。 支援 Google Drive 及 Microsoft OneDrive 上傳 根據 OpenAI,現在用戶可以直接從 Google Drive 和 Microsoft OneDrive 上傳檔案,不再需要先下載再上傳至 ChatGPT。這項功能使 AI 聊天機器人能夠存取 Google 服務,如 Sheets、Docs、Slides,以及 Microsoft 平台的 Excel、Word 和 PowerPoint。 可擴展的表格和圖表視圖 另一項更新是引入可擴展的表格和圖表視圖功能。當用戶添加資料集時,ChatGPT 將創建一個互動式表格,並且可以將其擴展至全螢幕顯示。此外,用戶還可以點擊表格中的特定區域,以提出後續問題或選擇 ChatGPT 建議的提示。例如,用戶現在可以要求 ChatGPT 合併包含每月支出的多個試算表,並根據支出類型創建樞紐分析表。這些更新大大提升了 ChatGPT 處理和分析資料的便捷性和效率。
-
Google 推出 Gemini 1.5 Flash:反應速度更快
昨天,OpenAI 宣佈推出 GPT-4o,重點是加快回應速度,而今天 Google 宣佈推出新的型號 Gemini 1.5 Flash,這款產品標榜擁有更低的延遲與成本,是 Gemini 1.5 Pro 的輕量化版本。Gemini 1.5 Flash 旨在為大規模服務提供快速且高效的解決方案。 開發者與客戶的全新選擇 目前,Gemini 1.5 Pro 與 Gemini 1.5 Flash 已於 Google AI Studio 及 Vertex AI 平台以公開預覽版形式推出,兩者皆提供一百萬個詞元的脈絡長度。Google Cloud 的客戶與開發者現可申請加入等候名單,以使用二百萬個詞元脈絡長度的 Gemini 1.5 Pro。 性能與應用 Gemini 1.5 Flash 在 Gemini 型號系列中擁有最快的處理速度。它專為大規模且頻繁的任務進行了最佳化,不僅能降低服務成本,還能顯著擴大脈絡長度。儘管其體積較 1.5 Pro 更輕盈,但在處理大量數據時,1.5 Flash 展現了強大的多模態推理能力,這得益於從 1.5 Pro 透過提取過程繼承而來的核心知識和技能。 強化的多模態推理能力 Gemini 1.5 Flash…
-
ChatGPT for Mac 只支援 Apple Silicon 無法支援 Intel Mac
OpenAI 宣佈 ChatGPT 為 Mac 推出桌面版應用,然而 Mac 用戶發現,該 App 只能支援 Apple Silicon,對於Intel x86 Mac 卻無法支援。事實上,Windows 版 ChatGPT 仍未正式發佈,OpenAI 表示會在今年稍後時間推出 Windows 桌面版本。 不過 ChatGPT for Mac 有其特點,它本身設 Launcher,啟動後用戶只需按 Function + Space 鍵即可立即呼喚 ChatGPT,用戶可即時提問。同時,用戶也可直接上載圖片或檔案進行分析,當中設有 Take Screenshot 功能,可即時擷取螢幕畫面。 ChatGPT for Mac 已開放給 ChatGPT Plus 用戶下載,至於免費版用戶則會在稍後時間分批推出。 如果用戶想使用桌面版,也可透過另一套 ChatBot 應用 Poe 來實現,它支援 Mac(x86 或 Apple Silicon)及 Windows 版本。
-
OpenAI 宣佈推出 ChatGPT for Mac 比 Windows 版更早推出?
OpenAI 在其春季更新發表會上宣佈,將推出全新的 Mac 桌面應用,使 ChatGPT 更便於使用者存取。此次更新將 ChatGPT 帶入 Mac 電腦,讓使用者能隨時隨地使用此人工智能平台。 Apple 與 OpenAI 的合作進展 在 WWDC 之前,已有傳聞 Apple 與 OpenAI 將建立合作夥伴關係,外界指 ChatGPT 有可能成為 iOS 18 內建的聊天機器人選項。在此合作宣佈之前,OpenAI 先行發佈了針對 Mac 的 ChatGPT App,比 Windows 支援來得更要早。 Mac 桌面應用的特色與功能 對於免費和付費的使用者來說,OpenAI 同時推出了一款新的 ChatGPT 桌面應用,該應用能無縫整合到 Mac 電腦的各種操作中。使用者僅需利用簡單的鍵盤快捷鍵(Option + Space),即可立即向 ChatGPT 提問。此外,使用者還可以在應用中直接拍攝並討論螢幕截圖。 現在,使用者可以直接透過電腦與 ChatGPT 進行語音對話,首先推出的是已有的語音模式,未來將搭載 GPT-4o 的新音訊和影片功能。不論是為公司構思新點子、準備面試,或討論某個話題,只需點擊桌面應用右下角的耳機圖示即可開始語音對話。 推出時間表與未來計劃 ChatGPT for Mac 將首先向…
-
OpenAI 推出 GPT-4o 新功能一覽
OpenAI 在今日的春季發佈活動中,宣佈推出最新發佈的 GPT-4o Model,當中 (“o”代表“omni”)這標誌著在更自然和多樣化的人機互動方面取得了重大進展。 反應速度更快 GPT-4o的一個突出特點是其對音頻輸入的快速反應時間。它可以在僅232毫秒內做出回應,平均反應時間為320毫秒,這與人類的對話速度非常接近。這一改進使得GPT-4o成為現有模型中更高效的替代品,提供更快且更具成本效益的性能。具體來說,它在英語文本和編碼方面達到了GPT-4 Turbo 的水準,在非英語語言方面表現出色,並且處理請求的成本顯著降低——通過API便宜50%。 聲畫處理能力提升 GPT-4o在視覺和音頻理解方面的進步尤其值得注意。之前的模型,如使用 Voice Mode 的 GPT-3.5 和 GPT-4,處理音頻輸入需要多步驟過程,導致更高的延遲(GPT-3.5為2.8秒,GPT-4為5.4秒)且丟失了很多上下文信息。這些模型使用單獨的系統來將音頻轉錄為文本、處理文本以及將文本轉換回音頻,這限制了它們識別語氣、處理多個講話者或解釋背景噪音的能力。 即時語音對話功能 GPT-4o 不僅提供與 GPT-4 相當的智能水平,還在速度和功能上有所提升。例如,用戶現可將不同語言的餐牌拍照後,直接與 GPT-4o 交談來翻譯並了解食物的歷史與重要性,同時獲得餐點建議。OpenAI 預計在未來引入更自然的即時語音對話功能,並能透過實時影片與 ChatGPT 互動,如解說直播體育賽事的規則等。 支援超過 50 種語言 GPT-4o 的語言處理能力在質量和速度上均有顯著提高,現支援超過 50 種語言。OpenAI 已開始將 GPT-4o 推廣至 ChatGPT Plus 和 Team 使用者,企業用戶也將很快獲得服務。此外,GPT-4o 亦已對所有用戶開放,但免費用戶將受到使用限制,其中 Plus 用戶的消息限制是免費用戶的 5 倍,Team 和企業用戶則有更高的限制。 免費用戶同樣享有新功能 OpenAI 的使命包括為更多人提供先進的 AI 工具。目前,每週已有超過一億人使用 ChatGPT。未來幾週,OpenAI 將逐步為免費用戶提供更多智能工具和功能,這包括使用…
-
OpenAI 自家 AI 搜尋器下周發佈 挑戰 Google 地位
據《路透》引述未具名消息人士報導,OpenAI 將於 5 月 13 日週一公佈其將發佈基於人工智能的搜尋引擎。報導指出,該搜尋引擎公佈的確切日期可能會有變動。若確實選擇 5 月 13 日進行發佈,將在 Google 年度 I/O 開發者大會前一天舉行。 AI 搜尋器競爭 OpenAI 的搜尋引擎將與 Google 搜尋和 Microsoft 的 Bing 搜尋引擎競爭,同時也將面對其他基於人工智能的搜尋初創公司如 Perplexity 的挑戰。Perplexity 由前 OpenAI 研究員創立,最近從 Nvidia 和亞馬遜創辦人 Jeff Bezos 那裡獲得了 7360 萬美元的 B 輪融資。 OpenAI 的搜尋引擎特色 據《彭博》引述消息人士報導,此搜尋引擎將使用其 ChatGPT 人工智能聊天機器人作為基礎,能夠在網上搜索問題和查詢的答案,並將為其搜尋結果提供來源引用。 OpenAI 與科技巨頭的合作 儘管 Microsoft 繼續是 OpenAI 的主要財政和開發合作夥伴,但該公司似乎正在逐步擴展其業務範圍,並與其他科技巨頭進行談判。4 月下旬有報導稱,OpenAI 已與 Apple 進行對話,討論將人工智能技術整合進 iOS…
-
OpenAI 與 Stack Overflow 合作 為 ChatGPT 引入更多技術知識
OpenAI 日前宣布與開發者平台 Stack Overflow 達成合作,旨在提升人工智能型號的表現,並將更多技術資訊整合至 ChatGPT 中。此合作將使 OpenAI 能夠接入 Stack Overflow 的 API 並獲得開發者社群的反饋,用以改善人工智能型號的性能。作為回報,OpenAI 將在 ChatGPT 中加入指向 Stack Overflow 內容的連結。當用戶透過 ChatGPT 提出編程或技術相關問題時,將能看到來自 Stack Overflow 知識庫的更多資訊。雙方在新聞稿中表示,此舉將「促進用戶對內容的更深入互動」。 Stack Overflow 擴展其 Overflow AI 應用 Stack Overflow 將使用 OpenAI 的大型語言模型來擴展其去年宣布的生成式人工智能應用,Overflow AI。Overflow AI 將增加人工智能驅動的自然語言搜索功能到 Stack Overflow。Stack Overflow 指出,它將結合社群反饋和對 OpenAI 型號的內部測試,規劃為其用戶製作更多人工智能產品。 未來整合的展望 首批整合將在今年上半年推出,但 Stack Overflow 尚未明確指出首批將推出的整合內容。Stack Overflow 於二月與 Google 達成類似的協議,Google Cloud…
-
被吹捧為 AI 隨身裝置的 Rabbit R1 原來只是 Android App?
自從上週發佈以來,Rabbit R1 AI 裝置引發了許多問題,首要就是「為何不直接做成應用程式?」現在,答案已揭曉:它確實只是一個應用程式。 《Android Authority》的記者 Mishaal Rahman 在 Google Pixel 6A 上成功下載了 Rabbit 的啟動器 APK。經過些許調整後,他能夠像在 Rabbit 自家裝置上一樣運行該應用程式,使用音量增加鍵來代替 R1 的單一硬體按鈕,成功設定帳戶並開始提問。 Rahman 指出,這款應用程式可能無法提供與 R1 相同的全部功能。他表示,Rabbit R1 的啟動器應用程式原本應預裝於韌體中,並獲得數個系統級別的特權權限——儘管他們只能授予其中的一些,因此如果嘗試使用,某些功能可能會失效。 但事實上,這款軟體能在將近兩年前的中階手機上運行,這表明它與普通的 Android 應用程式沒有太大差異。 對此,Rabbit 創始人兼 CEO Jesse Lyu 表示不同意這種說法。他向《The Verge》發表了一份長篇聲明,部分引述如下,完整內容已發佈在 Rabbit 的 X 帳戶上。 Jesse Lyu 表示:「Rabbit R1 不是 Android App, Rabbit OS 和 LAM 運行於雲端,並進行了非常特定的 AOSP 和底層韌體修改,因此一個沒有正確作業系統和雲端端點的本地非法 APK…
-
蘋果發佈可直接在裝置運行的開源 LLM AI 模型 OpenELM
蘋果今日發佈了幾款設計於裝置上運行的開源大型語言模型,而不是透過雲端服務。這些模型統稱為 OpenELM,並已在 Hugging Face Hub 上提供,該平台是一個共享人工智能代碼的社區。 根據白皮書的說明,OpenELM 系列包括 8 款模型,其中 4 款利用 CoreNet 圖書館進行預訓練,另外 4 款進行了指令調校。蘋果採用的逐層縮放策略旨在提升模型的準確性和運行效率。 此次蘋果提供了完整的代碼、訓練日誌以及多個版本的模型,而不僅是最終訓練好的模型。研究團隊希望這能加快人工智能語言領域的發展並獲得「更可靠的結果」。例如,在約十億參數的限制下,OpenELM 的準確度較 OLMo 提高了 2.36%,同時所需的預訓練標記數量減半。 蘋果這一舉動打破了先前僅提供模型權重和推理代碼,以及在私有數據集上進行預訓練的常規做法。這次發佈包括了一套完整的訓練和評估語言模型的框架,其中包括訓練日誌、多個檢查點以及預訓練配置。 蘋果表示,發佈 OpenELM 模型旨在「賦予並豐富開源研究社區」,提供最先進的語言模型。開源模型的分享讓研究人員有機會探討相關風險、數據及模型偏差。開發者和公司可以原樣使用這些模型,或根據需要進行修改。 開放共享信息成為蘋果吸引頂尖工程師、科學家和專家的重要策略,因為它為通常不可能在蘋果嚴格保密政策下發表的研究論文提供了機會。 雖然蘋果尚未在其裝置中實現這類大型語言模型的運行能力,但據預測 iOS 18 將引入多項新的人工智能功能,且有傳言稱蘋果計畫為了保護隱私,在裝置上直接運行這些大型語言模型。
-
路透社:晶片禁令下中國仍能獲取 Nvidia AI 晶片
根據《路透》所查閱的文件,儘管美國擴大了對 Nvidia AI 晶片的出口管制,但中國十個具政府背景的機構在去年 11 月 20 日至今年 2 月 28 日間,仍從 Super Micro、Dell 以及技嘉科技等知名供應商處獲取這些晶片。 涉及的中國機構及企業 這些購買者包括中國科學院、山東人工智能研究院和湖北地震局等著名機構,以及多所大學、一家由省級政府擁有的科技投資公司、一個國營航空研究中心和一個太空科學中心。 潛在違規問題 這些交易是通過 11 家鮮為人知的中國零售商完成的,引發了人們對於這些零售商是否擁有在美國加強出口管制前就已獲得的庫存的疑問。Nvidia 表示,招標中指定的產品是在管制措施實施前出口和供應的,並聲稱這些購買並不表明違反出口管制規則。然而,專家指出,由於供應鏈下游的可見度有限,晶片可能在製造商不知情的情況下被轉移到中國。 美國商務部回應 據報導,美國商務部正在監控受限晶片的潛在轉移,並調查可能的違規行為。違反美國出口管制規定可能導致嚴重的處罰,包括罰款和監禁。
-
TikTok 將推出 AI 聲音模仿功能 10 秒就能將你的聲音複製
據報導,TikTok 正在開發一項新的人工智能功能,能讓你在幾秒鐘內複製自己的聲音。TheSpAndroid 在 TikTok App 的最新版本中發現了一些代碼字符串,暗示 TikTok 正在開發這項 AI 聲音功能,但尚未有發佈時間表的消息。此功能一旦開啟,有人擔心「語音」從此不再可靠,因為可以被 AI 模仿! 用 AI 創建你的聲音 該網站發現了「TikTok 聲音庫」和「用 AI 創建你的聲音」等參考字眼,表明 TikTok 可能還未為此功能命名。它訪問了初始的用戶介面並查看了「TikTok 聲音庫」的條款和條件。 根據該媒體分享的功能截圖,你將能夠複製你的聲音並在 TikTok 影片中使,截圖顯示:「在僅 10 秒鐘內創建你的 AI 聲音!你將能夠在 TikTok 影片中使用文字到語音功能,」 隱私保護措施 截圖提到,TikTok 將處理你的聲音錄音並使用該資訊來生成你的 AI 聲音。據該網站稱,你將需要閱讀應用程式提供的一些文本並通過用戶介面錄製你的聲音。然而,由於當時沒有顯示任何文本,手動按下錄製按鈕也導致錯誤,因此無法生成任何聲音樣本。 你生成的 AI 聲音將保持私有,你可以隨時從聲音庫中刪除它,防止他人在其內容中使用你的聲音。使用者可能只需錄製一次聲音,就能在影片中透過文字到語音添加 AI 聲音。
-
Adobe Firefly 被指用 Midjourney 生成影像進行訓練
Adobe 在去年推出了其人工智能影像生成模型 Firefly,宣稱該 AI 模型主要使用 Adobe Stock 的數以億計的授權影像進行訓練。Adobe 聲稱,Firefly 是一個相較於其他競爭對手,如 Midjourney,使用從網際網路大量抓取影像訓練的「商業安全」選擇。然而,背後實際上 Adobe 也部分依賴來自這些競爭對手的人工智能生成內容來訓練 Firefly,這一點從未在眾多關於 Firefly 安全性的公開發表和貼文中被明確提及。 AI 模型多用網上圖訓練 訓練人工智能型號所需的大量資料正在受到越來越多的關注,尤其是在使用有版權的材料進行此過程中。Midjourney、Dall-E 的開發者 OpenAI 和 Stable Diffusion 的製造商 Stability AI 等公司建立他們的媒體生成型號時,採取了從網際網路搜集影像的做法,這引起了眾多藝術家的憤怒和訴訟。西安大略大學的助理教授 Luke Stark 表示,這揭示了「負責任的人工智能」定義的不明確性,也顯示了擺脫法律或社會文化問題的困難。 Firefly 以 AI 生成影像訓練引道德爭議 儘管 Adobe 曾公開批評其他公司的資料搜集實踐,但公司內部對於吸收人工智能生成影像到 Firefly 型號中的倫理和形象存在分歧。有員工建議逐步淘汰這些生成影像,但據了解目前沒有這樣的計劃。Adobe 的高級副總裁 Ashley Still 在本月初一次《彭博》智庫活動中提到,企業客戶對 Adobe 的做法表示讚賞,因為他們不會像其他公司那樣,在公開網路上竊取知識產權。 透明度問題 儘管 Adobe 在其網站和網誌中強調只使用授權或公共領域的資料來訓練 Firefly,但公司從未公開明確表示 Firefly 部分訓練資料來自競爭對手的工具。不過,Adobe 在運行的兩個 Discord…
-
xAI 發佈全新 Grok-1.5V 挑戰 GPT-4
xAI 宣佈推出其最新 AI 模型 Grok-1.5V(Grok-1.5 Vision),標誌著向真正智能系統邁進的重大步驟。xAI 指出,Grok-1.5V 不僅僅能理解文字,還整合了視覺功能,能夠理解文件、圖表、照片等更多內容。 在關鍵基準上超越競爭對手 據 xAI 表示,Grok-1.5V 在關鍵基準上超越了領先的競爭對手。在 xAI 的 RealWorldQA 數據集上表現卓越,該數據集涵蓋了超過 700 張真實世界圖片與問題,評估了人工智能理解複雜視覺場景的能力,並衡量了向全面智能的進展。 多面向的感知能力 Grok-1.5V 的多面向感知能力通過例如將兒童畫作轉化為睡前故事的示例來展示。它還解釋了迷因、將表格轉換成 CSV 格式,並僅憑圖像診斷木質甲板的問題。xAI 認為,這些多樣的任務展示了 Grok-1.5V 在廣泛應用領域的潛力。 Elon Musk 的人工智能願景 Elon Musk 於 2023 年 7 月創辦了 xAI,他表示,xAI 的目標是創造出更透明、更有責任感的人工智能,以更好地與人類協作。目前,人工智能的嚴肅性成為公眾討論的熱點,不同意見包括對職位的影響、對其藝術能力的質疑,以及對學生使用人工智能完成家庭作業的看法。 尋找 Grok-1.5V 的初期測試者 在未來幾個月,xAI 預計將專注於提高 Grok 的多模態推理的可視化和解釋。公司即將尋找 Grok-1.5V 的首批測試者,以提供反饋並幫助改進其多模態推理能力。Grok beta 的訪問最初僅限於 X 的 Premium+ 訂閱者,他們將獲得額外的福利和支持。
-
AI 起飛 美空軍將進行 AI 戰機飛航測試
隨著 AI 蓬勃發展,其軍事目的也愈來愈受到重視,近日,美國空軍部長 Frank Kendall 在參議院聽證會上,宣布將會躬身檢測一台改裝為無人機的 F-16 戰機的飛航測試,以評斷 AI 操控無人機的飛行表現。 自俄烏戰爭到以巴衝突,現代戰爭中,無人機已經成為主要的攻擊武器之一,這也是為何美國空軍如今積極發展無人機技術的原因之一。 前述聽證會上,空軍要求政府於 2025 年為空軍投入 5.59 億美元的預算,以利空域相關的軍事研究,其中包含自數年前開始的協作戰機 (CCA) 計畫,該計畫預想讓一名人類飛行員同時指揮多架 AI 操控的無人僚機,以較少的人力組成一個具有軍事價值的機隊。 至於這些無人僚機未來會是全尺寸戰機,或是以其他種類的飛行器現身仍不得而知。但這次改裝的 F-16 戰機若飛行表現優異,將可視為此計畫的重要里程碑。有鑑於此,美空軍部長將會偕同一名飛行員,親自坐進駕駛艙檢測飛行狀況,並希望這次的飛行能在無人類干預的條件下完成。
-
Android Studio 整合 Gemini 1.0 Pro AI 簡化編寫 Android App 製作
Google 近日宣佈,將 Gemini 1.0 Pro 整合至 Android Studio 中,以協助開發者更迅速地編寫出更優質的程式碼。儘管此次是一次重大的模型更新,Gemini 在 Android Studio 中仍處於預覽階段,目前為開發者免費使用。 Android Studio 內建的編碼助手 Gemini 在 Android Studio 的設計,旨在直接嵌入編程環境中,為開發者提供輔助。它不僅可以幫助生成應用程式碼、提供複雜的程式碼完成建議,還能回答開發者的疑問、尋找相關資源、新增程式碼註解等。 縮短 Android 程式編寫時間 自從 ChatGPT 對外公開後,人們便開始利用它來獲得編碼幫助,而從那時起,編碼相關的機器人工具只有變得更加精準。早期,由於擔憂資料收集的問題,許多科技公司曾要求員工停止使用這些機器人工具進行編碼工作。 為了消除隱私方面的顧慮,Google 強調,Gemini 在 Android Studio 的設計初衷就是將隱私放在首位。Gemini 僅在用戶登入並啟用後可用,大部分功能的使用不需發送程式碼上下文。預設情況下,Gemini 在 Android Studio 中的對話回應純粹基於對話歷史,開發者可以控制是否想分享更多上下文以獲得客製化回應。 免費開放試用 對於希望一試 AI 編程的開發者而言,現在可以透過 Android Studio Canary 版本中的「Gemini API Starter」範本開始著手開發具備生成 AI 功能的應用程式,操作路徑為「檔案 > 新專案 > Gemini API…
-
Spotify 推出 AI Playlist 智能播放清單功能
Spotify 官方近日在其網誌上發佈消息,宣布推出一項名為 AI Playlist 的測試版功能,旨在進一步提升音樂發現和播放清單定制體驗。這項新工具現已對英國和澳洲的 Spotify Premium 用戶開放,支援 Android 和 iOS 設備。 自創 AI Playlist Spotify 指出 AI DJ 和日播清單等功能已經助力用戶更接近他們喜愛的歌手。AI Playlist 進一步擴展了這一體驗,允許用戶透過輸入獨特的 Prompt 提示信息來創建新的播放清單,無論是尋找「給我大腦一個溫暖擁抱的獨立民謠播放清單」、「過敏季節聽的放鬆音樂」,還是「讓我感覺像主角的播放清單」,AI Playlist 都能滿足需求。 操控簡易個性化選擇 創建 AI 智能播放清單極其簡單:用戶只需在 Spotify 移動應用的「Your Library」頁面中,點擊右上角的「+」按鈕並選擇「AI Playlist」。 隨後,用戶可以選擇建議的 Prompt 提示或輸入自己的創意提示,如「繪畫枯萎花朵時聽的悲傷音樂」或「騎馬進入日落的曲目」。Spotify 將根據用戶的要求提供相匹配的曲目,用戶還可以預覽和刪除曲目,並通過反饋來調整和完善播放清單。 英國和澳洲率先試 雖然這項功能目前仍處於測試階段,目前AI Playlist 不支持與非音樂相關的 Prompt,並且對冒犯性的提示設有相應的控制措施。英國和澳洲的 Premium 用戶將享受到這種全新的音樂發現方式,未來幾個月,會將擴展到其他地區。
-
OpenAI CEO 與 Jony Ive 聯手打造 AI 個人裝置 正在募集資金
據《The Information》報導,OpenAI 的 CEO Sam Altman 與前蘋果設計總監 Jony Ive 正式聯手,致力於設計一款 AI 驅動的個人裝置,並正在尋求資金支持。 脫離傳統智能手機設計 目前關於這款 AI 裝置的細節尚不為人知,但確定一點是,它不會是一款看起來像智能手機的產品。鑑於 Altman 曾是 Humane AI 項針的主要投資者,這是一款不帶螢幕的可穿戴 AI 裝置,因此他很可能會與 Ive 合作創造出類似的產品。 籌集高達 10 億美元的資金 Jony Ive 與 Altman 之間的可能合作消息首次於去年秋季浮出水面,但當時談判處於初期階段,並未有任何官方確認。如今,Jony Ive 與 Altman 的未命名新創公司正從主要風險資本家那裡籌集資金,其中 Jony Ive 旨在籌集高達 10 億美元的資金。 有望成為 OpenAI 業務的一部分 OpenAI 可能擁有該業務的一部分,而這對夥伴還與 SoftBank 的 CEO 孫正義進行了談話。潛在的投資者包括 Thrive Capital(一家 OpenAI 的投資者)以及由…
-
ChatGPT 現已開放無帳號者使用
ChatGPT 推出至今已一年有餘,它也逐漸成為人們日常不可或缺的工具。為此,不少人註冊了 OpenAI 的帳戶,就為了能夠享受 AI 帶來的便利之處。而如今 OpenAI 宣布,未來 ChatGPT 已不再需要註冊或登入帳戶即可直截使用,大大增加了 ChatGPT 的易用程度。 這項調整將會陸續應用於各地區的 ChatGPT,因此目前使用者可能仍需登入帳戶才得以使用 ChatGPT。 此外,為了改善 ChatGPT 的語言模型,OpenAI 會蒐集使用者的對話紀錄。如果你不希望對話紀錄被用以研究,可以在設定中將這項功能關閉。 ChatGPT 官方網頁
-
Elon Musk xAI 發佈 Grok-1.5 稱部份領域超越 GPT-4
Elon Musk 旗下的 xAI 公司最近對外發佈了 Grok-1.5 版本,這是對其人工智能模型的一次重大更新。該更新旨在提升其在數學、編程等方面的表現,並已向早期測試者開放。公司聲稱,Grok-1.5 在多個領域與 GPT-4、Gemini Pro 1.5 及 Claude 3 Opus 等模型相比,展現出了顯著的改進。 數據表現:數學與編程能力的顯著提升 根據 xAI 公司提供的數據,Grok-1.5 在 MATH 基準測試中的得分較之前版本翻了一番多,達到了 50.6%。在處理 GSM8K(數學文字問題)和 HumanEval(編程)測試時,分別達到了 90% 和 74.1% 的得分,較之前的 62.9% 和 63.2% 有了顯著的提升。這些數據接近甚至超過了 Gemini Pro 1.5、GPT-4 和 Claude 3 Opus 等競爭對手,尤其是在 HumanEval 編程測試中,其表現超越了除 Claude 3 Opus 之外的所有競爭對手。 支持 128K tokens Grok-1.5 支持處理長達 128K tokens…