AI 基準測試組織因延遲揭露 OpenAI 資助而遭受批評:FrontierMath 的爭議與反思

AI 基準測試組織因延遲揭露 OpenAI 資助而遭受批評:FrontierMath 的爭議與反思 隨著人工智慧(AI)研究持續快速演進,各式各樣的基準測試(benchmark)也如雨後春筍般推出,幫助研究人員與開發者評估模型在不同領域的能力。然而,近期有一個關於數學基準測試的爭議,再次凸顯了「資金來源」與「客觀性」之間的微妙平衡。 事件背景 1 月 19 日,TechCrunch 的記者 Kyle Wiggers 報導指出,專門開發 AI 數學測驗基準的組織 Epoch AI,在資金來源方面並未及時向外界揭露自己收到了 OpenAI 的資助,一直到 2024 年底、甚至是 2025 年才陸續對外公開此訊息。Epoch AI 是一家非營利組織,其主要經費來自研究與補助機構 Open Philanthropy。該組織在去年推出了一套名為 FrontierMath 的測驗,用於測試 AI 是否能通過「專家級」的數學題目。 FrontierMath 這套測驗顯然深受矽谷和 AI 社群的關注,因為 OpenAI 就曾利用這個測驗對外展示自家最新旗艦 AI 系統 o3 的能力。然而,直到 2024 年 12 月 20 日,Epoch AI 才在一篇公告中透露 OpenAI 為 FrontierMath 的開發提供了資助,並擁有對 FrontierMath 題目與解答的可見度。 「資訊不透明」引發的爭議 在知名理性思考與 AI 安全論壇 LessWrong 上,一位名為「Meemi」的 Epoch AI 合約人員發文表示,許多參與 FrontierMath 題目編寫與貢獻的成員,並不知情 OpenAI 與該測驗的關係,甚至到了官方正式宣布後才知道。由於 FrontierMath 先前一直標榜其獨立、客觀性,此事讓部分 AI 社群人士質疑,是否因為拿到 OpenAI 資金,Epoch AI 並未及時釐清與 OpenAI 的合作關係,以避免外界產生利益衝突的觀感。 ...

2025/01/22 15:28 · 1 min · 192 words · Danny H.

ChatGPT 新增提醒與重複任務功能

OpenAI 宣布,其 ChatGPT 現已推出測試版的新功能「任務」(Tasks),讓付費用戶能設定提醒或重複性請求。這項功能本週將開始逐步向 ChatGPT Plus、Team 與 Pro 用戶全球推出。 任務功能簡介 透過任務功能,用戶可以讓 ChatGPT 設定簡單的提醒,例如:「提醒我六個月後我的護照會到期。」AI 助理會在用戶啟用任務功能的平台上發送推送通知。此外,用戶還可設定重複性請求,例如:「每週五根據我的位置和天氣預測提供週末計劃」或「每天早上 7 點提供新聞簡報」。 圖片來源:OpenAI 這項功能標誌著 OpenAI 在 AI 代理(agentic system)領域的第一步。OpenAI CEO Sam Altman 表示,2025 年將是 AI 代理的重要一年,並預言這些代理將在今年「加入工作隊伍」。雖然任務功能目前的範圍有限,但它為用戶提供了如同 Siri 和 Alexa 等助理具備的基本提醒功能,同時展示了其他數位助理尚未具備的新能力。 如何使用任務功能 用戶可以在 ChatGPT 的下拉選單中選擇「4o with scheduled tasks」進入任務功能。接著,只需向 AI 助理發送訊息,說明希望設定的提醒或動作。某些情況下,ChatGPT 可能會根據聊天內容建議設定相關任務。用戶也可以透過任何平台的聊天界面或網頁版專屬的「任務管理」標籤管理這些任務。 雖然 ChatGPT 可以按排程瀏覽網頁,但它目前不會執行連續背景搜索,也無法進行購物。舉例來說,用戶可以指示 ChatGPT 每月查詢一次是否有喜愛歌手的演唱會門票,但無法即時提醒門票開賣,也無法自動購買票券。 未來展望與挑戰 這次測試版的推出,將幫助 OpenAI 了解用戶如何使用任務功能,進而為功能全面向行動應用程式與免費層用戶推出做好準備。目前,此功能不支援「進階語音模式」設定任務。 OpenAI 同時正準備推出更高階的代理系統,包括代號為 Operator 的系統。據報導,這項系統將具備寫程式碼和預訂行程等能力,並可能在未來幾週內發布。 然而,隨著更進階的代理系統逐步推出,潛在問題也會浮現。儘管任務功能展現了受控的代理能力範圍,未來 OpenAI 的安全措施將面臨更大的考驗。 總結 ChatGPT 的任務功能為 AI 助理帶來更多實用性,並為未來更複雜的 AI 代理系統鋪路。作為測試版,任務功能展現了 AI 在日常生活中的嶄新可能性,未來將有更多進階功能等待用戶探索。 ...

2025/01/15 10:31 · 1 min · 69 words · Danny H.

Nvidia 支援臺灣新創 MetAI

Nvidia 正積極推進其 Omniverse 平台,以建構機器人和其他工業 AI 應用,並推出了 Omniverse Blueprint 框架 Mega,專注於打造數位分身。為了推動這一領域的發展,Nvidia 不僅推出自家解決方案,也開始投資相關新創公司。 MetAI:快速生成數位分身的技術突破 台灣的新創公司 MetAI 開發了一種基於 AI 和 3D 技術的模型,能夠將 CAD 文件轉換為「SimReady」(模擬準備)數位分身,從而在數分鐘內生成可操作的 3D 環境。Nvidia 宣布參與 MetAI 的種子輪融資,這也是該晶片巨頭首次投資台灣的新創企業。 MetAI 的首輪融資額為 400 萬美元,其他參與者包括台灣的建美工業、Solomo Technology、SparkLabs Taiwan、Addin Ventures 和 Upstream Ventures。 MetAI 將其生成式數位分身技術應用於先進半導體工廠、智慧倉儲和自動化領域,同時也在這些數位分身環境中生成合成數據。這些技術有助於在實際部署之前,為機器人和自動化系統的 AI 訓練與驗證提供物理準確的模擬環境。 MetAI 的聯合創辦人兼 CTO 許任頓(Renton Hsu)指出,數位分身的快速生成突破了傳統上需要數月甚至數年的開發障礙,使其成為物理 AI 領域的重要助力。 與競爭者的差異化 數位分身技術的競爭者包括西門子數位工業(Siemens Digital Industries)、達梭系統(Dassault Systemes)、Hexagon AB、Duality AI 和 Intangles 等,而在合成數據領域的競爭對手則有 Sky Engine 和 Scale AI 等公司。 MetAI 強調其獨特性在於利用生成模型和 AI 驅動的佈局,專注於為物理 AI 訓練設計的數位分身,這不僅加速了數位分身的創建,也確保其能直接應用於先進的自動化系統,實現模擬與現實的無縫銜接。 “MetAI 的核心在於構建動態虛擬世界,即操作與真實世界相同的模擬環境,這些環境能根據特定需求生成定制化的合成數據,用於 AI 的訓練與驗證,”MetAI 的 CEO 兼聯合創辦人游偉傑(Daniel Yu)說道。 ...

2025/01/15 10:13 · 1 min · 120 words · Danny H.

微軟準備建構新的AI 平台 CoreAI

AI 平台轉型進入新階段 2025 年,AI 的平台轉型邁入了下一個關鍵階段。根據 Satya Nadella 的說法,我們正迎來以模型為中心的應用時代,這些應用將全面重塑所有應用類別。這場變革不僅波及應用堆疊的每一層,還相當於將 30 年的技術發展濃縮為短短 3 年。 這次的轉型核心在於 agentic 應用 的興起,這些應用將具備記憶、權限以及行動空間,並藉此賦予模型更強大的能力,涵蓋多種角色、業務流程和行業領域。尤其在安全性與性能上,微軟計劃推出深度適應性技術,確保應用在不同情境下均能發揮最佳效果。 新 AI 優先應用堆疊 微軟正在構建全新的 AI-first 應用堆疊,包括以下核心元素: 全新 UI/UX 模式:適應 AI 驅動應用的互動設計。 多代理執行框架:支援創建、編排多個智能代理的運行時環境。 重新構想的管理與觀測層:幫助開發者深入理解與優化 AI 應用。 在這個堆疊中,Azure 不僅是 AI 的基礎設施,更是支撐整個 AI 平台的關鍵,而 Azure AI Foundry、GitHub 以及 VS Code 將共同打造服務於第一方與第三方開發者的生態。 CoreAI 部門的成立 為了快速推進這些目標,微軟宣布成立 CoreAI – Platform and Tools 新部門。此部門將整合以下團隊資源: 開發者部門 (Dev Div) AI 平台 CTO 辦公室部分團隊(包括 AI 超級電腦、AI Agentic 運行時環境及 Engineering Thrive 團隊) 該部門的核心任務是建立端到端的 Copilot 與 AI 堆疊,涵蓋 GitHub Copilot 的進一步開發,形成以產品反饋推動技術演進的良性循環。 ...

2025/01/15 10:00 · 1 min · 108 words · Danny H.

你為什麼需要關注「成本避免」

為什麼「成本避免」成為 AI 領域的熱門詞彙? 隨著人工智慧(AI)技術的快速發展,許多企業開始將「成本避免(Cost Avoidance)」視為證明 AI 價值的重要策略之一。這個術語不僅能夠幫助企業管理層在董事會中說服其他高層,還能用來解釋為何投資 AI 是合理的。 根據《華爾街日報》記者 Belle Lin 的觀察,企業正在用「成本避免」來為縮減招聘計劃提供依據,並藉此展現 AI 技術的價值。以下為文章中的幾個關鍵觀點。 什麼是「成本避免」? 成本避免的核心是透過引入 AI 技術,來 避免新增員工或減少現有員工的工作負擔。具體來說,這是一種「用同樣的資源完成更多工作」的策略,透過提升效率、取代重複性工作,達到削減人力成本的目的。 例如: TS Imagine 公司 COO Thomas Bodenski 表示,透過 AI 系統每年處理 10 萬封電子郵件,他們不僅避免了僱用 2.5 名全職員工的需求,還將處理成本降低至人力的 3%。 Palantir Technologies CIO Jim Siders 也指出,AI 的應用讓公司未來的招聘需求減少了 10% 至 15%,並將節省的資源投入到更具實驗性的新計劃中。 為何「成本避免」成為 AI 投資的重要論據? 1. 投資者的壓力 根據 KPMG 的調查,有 68% 的企業領導者認為,投資生成式 AI 的回報(ROI)是他們面臨的重要壓力來源。許多高層正試圖尋找方式證明 AI 的價值,而成本避免是一個直接且具說服力的方式。 2. 經濟壓力下的招聘縮減 在目前企業廣泛削減開支的大環境中,「成本避免」成為合理化 AI 投資的有效工具。即使 AI 的全面效益仍存疑,但通過減少新增員工的需求,它已幫助企業在短期內見效。 3. 效率提升與資源分配優化 對於像 Limbach Company 這樣的公司,CIO Christos Ruci 認為,AI 不僅減少了人力需求,還能通過升級現有員工的技能,讓他們更專注於高附加值的工作。 ...

2025/01/10 11:30 · 1 min · 135 words · Danny H.