觀看次數 1
https://80.lv/articles/voyager-gpt-4-powered-lifelong-learning-agent-for-minecraft/
編輯
“它通過編寫、改進、提交和從技能庫中檢索代碼來不斷改進自己。”
NVIDIA 的研究人員展示了 Voyager——第一個以 LLM 為動力的體現式終身學習代理,可以在上下文中玩 Minecraft。它“不斷探索世界,獲得各種技能,並在沒有人為乾預的情況下做出新發現。”
Voyager 由三個關鍵組件組成:
- 最大化探索的自動課程,
- 一個不斷增長的可執行代碼技能庫,用於存儲和檢索複雜的行為,
- 一種新的迭代提示機制,結合環境反饋、執行錯誤和程序改進的自我驗證。
“Voyager 通過黑盒查詢與 GPT-4 交互,這繞過了對模型參數微調的需要。……根據經驗,Voyager 顯示出強大的上下文終身學習能力,並且在玩 Minecraft 時表現出非凡的熟練程度。它獲得了 3.3 倍的獨特性項目,行進距離延長 2.3 倍,解鎖關鍵技術樹里程碑的速度比之前的 SOTA 快 15.3 倍。航海者能夠利用新 Minecraft 世界中學到的技能庫從頭開始解決新任務,而其他技術則難以推廣”
AI 科學家 Jim Fan解釋了AI 的工作原理:
“首先,Voyager 嘗試使用流行的 Javascript Minecraft API (Mineflayer) 編寫一個程序來實現特定目標。該程序在第一次嘗試時很可能是錯誤的。遊戲環境反饋和 javascript 執行錯誤(如果有)幫助 GPT- 4細化方案。
其次,Voyager 通過將成功的程序存儲在向量 DB 中來逐步構建技能庫。每個程序都可以通過嵌入其文檔字符串來檢索。複雜的技能是通過組合更簡單的技能來合成的,隨著時間的推移,這會復合 Voyager 的能力。
第三,自動課程根據智能體當前的技能水平和世界狀態提出合適的探索任務,例如,如果它發現自己在沙漠而不是森林中,則學習在鐵之前收穫沙子和仙人掌。
將所有這些放在一起,這是一個完整的數據流設計,可以在沒有任何人為乾預的情況下在廣闊的 3D 體素世界中推動終身學習。”