[討論] AGI 評鑑/預測

作者AmosYang (twy30)

看板Soft_Job

標題[討論] AGI 評鑑/預測

時間Fri Jul 4 11:56:47 2025

對 AGI (Artificial General Intelligence) 的進展有興趣的話可以看看 https://arcprize.org/ 這個 AGI 評鑑系統，尤其是試玩一下它的 2025 年版的 ARG-AGI-2 題目 ( https://arcprize.org/play )， * 看看你覺得這樣的題目對人腦來說的難易度 * 看看你覺得「符號解讀、組合推理、上下文規則應用」是否為 AGI 的必要條件 * 看看你覺得這些題組是否能有效測量「符號解讀、組合推理、上下文規則應用」然後參考以下數據 ( https://arcprize.org/leaderboard )： * 人腦最高分是 100%, 每個工作項目成本 $17 * 最高分的 AI (Claude Opus 4) 得分 8.6%, 每個工作項目成本 $1.93 * 次高分的 AI (ChatGPT o3) 得分 6.5%, 每個工作項目成本 $0.834 * 「純 LLM」 AI 最高分數 1.3% 2019~2024 年使用的 ARC-AGI-1 題目， AI 最高得分是約 75% 。另一個可以參考的網站是 https://theagiclock.com/ ，預測 AGI 到來的時間 (以及解釋它預測的根據); 可以 3~6 個月後來看看 AGI 的進展是線性、指數，還是卡關。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 136.47.253.135 (美國) ※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1751601414.A.648.html https://theagiclock.com/ 的預測是 2028-06-30 。 ※ 編輯: AmosYang (136.47.253.135 美國), 07/04/2025 12:00:02 ※ 編輯: AmosYang (136.47.253.135 美國), 07/04/2025 12:07:37 ※ 編輯: AmosYang (136.47.253.135 美國), 07/04/2025 12:10:57

推 jamesho8743: 有意思的網站謝分享 07/04 12:24

推 attacksoil: 有趣 07/04 12:36

=== https://theagiclock.com/experts 有更進一步列出各專家的預測及觀點；從 Elon Musk 的 2025~2026 到 Andrew Ng 的 2040~2060 都很有意思。 ※ 編輯: AmosYang (136.47.253.135 美國), 07/04/2025 12:42:54

推 haudoing: 還蠻好玩的我還沒輸XD 07/07 16:43

推 KAOKAOKAO: 本以為是抬槓文內容是有料資訊建議標題擴充 07/09 08:54

* 原標題： [討論] AGI * 新標題： [討論] AGI 評鑑/預測有其它擴充方向可以提出來討論。 ※ 編輯: AmosYang (136.47.253.135 美國), 07/11/2025 04:45:21 ※ 編輯: AmosYang (136.47.253.135 美國), 07/11/2025 04:47:47 Grok 4 拿下最高分 16%, 每工作項目成本 $2.17 ※ 編輯: AmosYang (136.47.253.135 美國), 07/11/2025 04:49:26