AI 基準測試組織因延遲揭露 OpenAI 資助而遭受批評:FrontierMath 的爭議與反思

AI 基準測試組織因延遲揭露 OpenAI 資助而遭受批評:FrontierMath 的爭議與反思 隨著人工智慧(AI)研究持續快速演進,各式各樣的基準測試(benchmark)也如雨後春筍般推出,幫助研究人員與開發者評估模型在不同領域的能力。然而,近期有一個關於數學基準測試的爭議,再次凸顯了「資金來源」與「客觀性」之間的微妙平衡。 事件背景 1 月 19 日,TechCrunch 的記者 Kyle Wiggers 報導指出,專門開發 AI 數學測驗基準的組織 Epoch AI,在資金來源方面並未及時向外界揭露自己收到了 OpenAI 的資助,一直到 2024 年底、甚至是 2025 年才陸續對外公開此訊息。Epoch AI 是一家非營利組織,其主要經費來自研究與補助機構 Open Philanthropy。該組織在去年推出了一套名為 FrontierMath 的測驗,用於測試 AI 是否能通過「專家級」的數學題目。 FrontierMath 這套測驗顯然深受矽谷和 AI 社群的關注,因為 OpenAI 就曾利用這個測驗對外展示自家最新旗艦 AI 系統 o3 的能力。然而,直到 2024 年 12 月 20 日,Epoch AI 才在一篇公告中透露 OpenAI 為 FrontierMath 的開發提供了資助,並擁有對 FrontierMath 題目與解答的可見度。 「資訊不透明」引發的爭議 在知名理性思考與 AI 安全論壇 LessWrong 上,一位名為「Meemi」的 Epoch AI 合約人員發文表示,許多參與 FrontierMath 題目編寫與貢獻的成員,並不知情 OpenAI 與該測驗的關係,甚至到了官方正式宣布後才知道。由於 FrontierMath 先前一直標榜其獨立、客觀性,此事讓部分 AI 社群人士質疑,是否因為拿到 OpenAI 資金,Epoch AI 並未及時釐清與 OpenAI 的合作關係,以避免外界產生利益衝突的觀感。 ...

2025/01/22 15:28 · 1 min · 192 words · Danny H.