Auto-GPT 揭露:其生產陷阱的炒作和硬道理

Auto-GPT 揭露:其生產陷阱的炒作和硬道理

科技界最近因 Auto-GPT 的驚人崛起而沸沸揚揚,Auto-GPT 是一種基於尖端 GPT-4 語言模型構建的實驗性開源應用程序。在短短 7 天的時間裡,這個項目名聲大振,積累了令人難以置信的 44,000 個 GitHub 星數,並吸引了開源社區。Auto-GPT 設想了一個未來,自主 AI 驅動的任務將成為常態,這是通過將大型語言模型 (LLM) 思想鏈接在一起實現的。

GitHub – Torantulino/Auto-GPT:一項使 GPT-4 完全自主的實驗性開源嘗試

然而,每一個一夜之間的成功都伴隨著成長的煩惱。在我們慶祝 Auto-GPT 的快速崛起之際,退後一步仔細審視其潛在缺點至關重要。在本文中,我們將深入探討這個 AI 神童在追求生產就緒過程中面臨的局限性和挑戰。因此,請係好安全帶,加入我們這一引人入勝的旅程,我們將在 Auto-GPT 的成名之路上一路前行。

Auto-GPT 是如何工作的?

Auto-GPT 一直在 AI 世界掀起波瀾,這是有充分理由的。這就像給基於 GPT 的模型賦予了記憶和身體,讓它們能夠獨立處理任務,甚至可以從經驗中學習。為了幫助您了解 Auto-GPT 的工作原理,讓我們使用簡單的隱喻對其進行分解。

將 Auto-GPT 想像成一個足智多謀的機器人。你給它分配一個任務,它會想出一個計劃來完成它。如果任務需要瀏覽互聯網或使用新數據,Auto-GPT 會調整其策略,直到任務完成。這就像擁有一個可以處理各種任務的私人助理,例如分析市場、客戶服務、市場營銷、財務等等。

四個主要組件使這個機器人滴答作響:

  1. 架構:Auto-GPT 是使用強大的 GPT-4 和 GPT-3.5 語言模型構建的,它們充當機器人的大腦,幫助它思考和推理。
  2. 自主迭代:這就像機器人從錯誤中學習的能力。Auto-GPT 可以回顧它的工作,在以前的努力的基礎上再接再厲,並利用它的歷史來產生更準確的結果。
  3. 內存管理:與矢量數據庫(一種內存存儲解決方案)集成,使 Auto-GPT 能夠保留上下文並做出更好的決策。這就像給機器人配備了長時記憶,可以記住過去的經歷。
  4. 多功能性:Auto-GPT 的文件操作、網頁瀏覽和數據檢索等功能使其用途廣泛,並使其有別於以往的 AI 進步。這就像賦予機器人多種技能來處理更廣泛的任務。

因此,Auto-GPT 是一種人工智能驅動的機器人,它承諾執行一系列不同尋常的任務,從其經驗中學習,並不斷提高其性能。然而,**重要的是要認識到這些誘人的前景可能尚未轉化為 Auto-GPT 可以提供的真正功能。**在探索其局限性和挑戰時,我們將重點關注以下關鍵領域:

  • 天價成本:任務完成的障礙
  • 合併世界:開發和生產難題
  • 循環泥潭:為什麼 Auto-GPT 陷入困境
  • Vector DB:矯枉過正的解決方案
  • 代理機制的誕生:一項正在進行的工作

通過深入研究這些關鍵方面,我們將為 Auto-GPT 的生產準備潛力提供一個平衡的視角。

天價成本:任務完成的障礙

雖然 Auto-GPT 承諾具有卓越的功能,但其在生產環境中採用的一個重大障礙是其高昂的成本。由於任務是通過一系列思維完成的,因此每個步驟都需要調用昂貴的 GPT-4 模型,該模型通常會最大化令牌以提供更好的推理和提示。

VueGPT 思路的第一步:Auto-GPT 創建的 AI,旨在使用 Vue JS 創建網站應用程序

GPT-4 代幣並不便宜。根據 OpenAI 的說法,具有 8K 上下文窗口的 GPT-4 模型對提示收取每 1,000 個令牌 0.03 美元,對結果收取每 1,000 個令牌 0.06 美元。讓我們分解思路鏈中每個步驟的成本,假設每個操作都最大化了 8,000 個標記的上下文窗口,其中 80% 是提示,20% 是結果。

對於 8,000 個代幣:

  • 提示 (80%):6,400 個代幣
  • 結果(20%):1,600 個代幣

提示成本:6,400 個代幣 x 0.03 美元/1,000 個代幣 = 0.192 美元 結果成本:1,600 個代幣 x 0.06 美元/1,000 個代幣 = 0.096 美元

每步總費用:0.192 美元 + 0.096 美元 = 0.288 美元

Auto-GPT完成一項小任務平均需要 50 步的情況並不少見。因此,完成單個任務的成本為:

任務成本:50 個步驟 x 0.288 USD/步驟 = 14.4 USD

完成一項任務的成本很快就會增加到相當大的數量,使得 Auto-GPT 當前的實施對於許多用戶和組織來說不切實際。

合併世界:開發和生產難題

乍一看,人們可能會認為 14.4 美元是找到聖誕食譜的合理價格。然而,當您意識到必須再次遵循相同的思路,再支付 14.4 美元才能找到感恩節食譜時,真正的問題就出現了。很明顯,為聖誕節或感恩節生成食譜應該只有一個“參數”不同:節日。最初的 14.4 美元用於開發創建食譜的方法。一旦建立,再次花費相同的金額來調整參數似乎不合邏輯。這揭示了 Auto-GPT 的一個根本問題:它無法將開發和生產分開。

使用 Auto-GPT 時,一旦實現目標並衍生出一系列思路,_開發階段就被視為完成。但是,沒有辦法將動作鏈“序列化”為可重複使用的函數供以後使用,即將_其投入生產。因此,用戶每次要解決問題時都必須從頭開始開發。與我們在現實世界中解決問題的方式相比,這種低效率浪費了時間和金錢,並且提出了不切實際的期望。

想像一下,每次開始遊戲或玩星際爭霸時,玩 Minecraft 並從頭開始構建一切,並且總是從紮根於基礎級別的科技樹開始。這種低效率水平會使這些遊戲變得不愉快和令人沮喪。

不幸的是,Auto-GPT 當前的實現不允許這種開發和生產的分離。它無法將操作鏈“序列化”為可重複使用的函數,從而迫使用戶為需求中看似微小的變化再次支付 14.4 美元。這種經濟效率低下引發了對 Auto-GPT 在實際生產環境中實用性的質疑。它強調了它在為解決大型問題提供可持續且具有成本效益的解決方案方面的局限性。

循環泥潭:為什麼 Auto-GPT 陷入困境

你可能會認為,如果 14.4 美元能真正解決一個問題,那它還是值得的。然而,不少用戶反映Auto-GPT經常陷入死循環,無法解決實際問題。幾條推文揭示了 Auto-GPT 在經過一整夜的思維鏈處理後仍然卡在循環中的實例。這些案例凸顯了一個現實,即在許多情況下,Auto-GPT 無法提供其承諾的解決方案。

為什麼 Auto-GPT 會陷入這些循環?

要理解這一點,可以將 Auto-GPT 視為依靠 GPT 使用一種非常簡單的編程語言來解決任務。解決任務的成功取決於兩個因素:該編程語言中可用的功能範圍和 GPT 的分而治之能力,即 GPT 可以將任務分解為預定義編程語言的能力。不幸的是,這兩個因素目前都不充分。

可以在其源代碼中觀察到 Auto-GPT 提供的有限功能。例如,它提供了搜索網絡、管理內存、與文件交互、執行代碼和生成圖像的功能。然而,這組受限的功能縮小了 Auto-GPT 可以有效執行的任務範圍。此外,GPT 的分解和推理能力仍然受到限制。雖然 GPT-4 相比 GPT-3.5 有了顯著提升,但其推理能力還遠未完善,進一步限制了 Auto-GPT 的問題解決能力。

](https://github.com/Torantulino/Auto-GPT/blob/361fed4e3222d5794833ffed8bf8e193f0bae8e3/scripts/prompt.py?ref=jina-ai-gmbh.ghost.io#L22-L42)

Auto-GPT 可以使用的函數或命令

這種情況類似於嘗試使用 Python 構建像星際爭霸這樣的複雜遊戲。雖然 Python 是一種功能強大的語言,但將星際爭霸分解為 Python 函數極具挑戰性。或者,這就像嘗試使用 BASIC(一種缺乏必要的網絡通信功能的語言)創建即時消息應用程序。本質上,有限的功能集和 GPT-4 的受限推理能力的結合導致了一個循環的泥潭,在許多情況下阻止 Auto-GPT 提供預期的結果。

通過 Python 構建星際爭霸可能有點過頭了。但是,建立在 Python PyGame 庫之上的Void Infinity是一款實時戰略遊戲,您可以在其中控制太陽系的行星來建立艦隊並消滅敵人。來源:https://www.pygame.org/project-Void+Infinity-2195-3815.html

人類與 GPT 的分而治之

分而治之是 Auto-GPT 的關鍵。雖然 GPT-3.5/4 比其前身有顯著進步,但在採用分而治之技術時,它仍然沒有達到人類水平的推理能力。問題分解不充分、難以識別合適的基本案例以及缺乏適應性和學習等挑戰都導致 GPT-3.5/4 在使用分治法解決複雜問題時存在局限性。

  1. **問題分解不充分:**分而治之的方法的有效性在很大程度上取決於將復雜問題分解為更小、可管理的子問題的能力。GPT-3.5/4 儘管有所改進,但仍然難以以允許高效和準確解決方案的方式持續有效地分解問題。人類的推理往往可以識別多種分解問題的方法,而 GPT-3.5/4 可能不具備同等水平的適應性或創造力。
  2. **難以確定合適的基本案例:**人類可以憑直覺選擇合適的案例來找到有效的解決方案。相比之下,GPT-3.5/4 可能難以為給定問題確定最有效的基本案例,這會顯著影響分而治之過程的整體效率和準確性。
  3. **對問題上下文的理解不足:**雖然人類可以利用他們的領域知識和上下文理解來更好地解決複雜問題,但 GPT-3.5/4 受其預訓練知識的限制,可能缺乏必要的上下文來使用分而治之有效解決某些問題-征服技術。
  4. **處理重疊的子問題:**人類通常可以在解決重疊的子問題時識別並戰略性地重用以前計算的解決方案。另一方面,GPT-3.5/4 可能並不總是具有相同的意識水平,並且最終可能會重複地多次解決相同的子問題,從而導致解決方案效率低下。

Vector DB:矯枉過正的解決方案

Auto-GPT 依靠向量數據庫來進行更快的 k 最近鄰 (kNN) 搜索。這些數據庫檢索較早的思想鏈,將它們合併到 GPT 的當前查詢上下文中以提供記憶效果。然而,考慮到 Auto-GPT 的約束和限制,這種方法被批評為過度和不必要的資源密集型。

反對使用矢量數據庫的主要論據源於與 Auto-GPT 思想鏈相關的成本限制。一個 50 步的思維鏈將花費 14.4 美元,而一個 1000 步的思維鏈成本要高得多。結果,思維鏈的內存大小或長度很少超過四位數。在這種情況下,最近鄰居的窮舉搜索(即 256 維向量和 10,000 x 256 矩陣之間的點積)被證明是足夠有效的,只需不到一秒即可完成。相比之下,每個 GPT-4 調用大約需要 10 秒來處理,使系統受 GPT 約束而不是數據庫約束。

具有百萬數據的基準矢量搜索數據庫

在 DocArray 中,DocumentArray 中的文檔可以存在於文檔存儲中而不是內存中。外部存儲提供更長的持久性和更快的檢索。有沒有想過哪一個最適合您的用例?這裡有一個綜合基準可以幫助指導您。

超過一百萬個向量的詳盡搜索需要 2.7 秒。而Auto-GPT中的“長記憶”多久能超過一百萬?

儘管矢量數據庫在特定場景中可能會提供一些優勢,但它們在 Auto-GPT 系統中用於加速 kNN“長記憶”搜索的實現似乎是一種不必要的浪費和矯枉過正的解決方案。在這種情況下使用矢量數據庫的主要理由似乎是開箱即用的用戶友好糖語法。

代理機制的誕生:一項正在進行的工作

Auto-GPT 引入了一個非常有趣的概念,允許生成代理來委派任務。然而,這種機制仍處於早期階段,其潛力在很大程度上尚未開發。有幾種方法可以增強和擴展當前的代理系統,為更有效和動態的交互開闢新的可能性。

一個潛在的改進是引入**異步代理。**通過合併async-await模式,代理可以並發操作而不會彼此阻塞,從而顯著提高系統的整體效率和響應能力。這個概念從採用異步方法同時管理多個任務的現代編程範式中汲取靈感。

使用異步代理可以顯著提高效率。來源:https://scoutapm.com/blog/async-javascript

另一個有前途的方向是實現代理之間的相互通信。通過允許座席進行溝通和協作,他們可以一起工作以更有效地解決複雜問題。這種方法類似於編程中的 IPC概念,其中多個線程/進程可以共享信息和資源以實現共同的目標。

生成代理是未來

隨著 GPT 驅動的代理不斷發展,這種創新方法的未來似乎一片光明。新的研究,例如 Park 等人的論文“Generative Agents: Interactive Simulacra of Human Behavior”,強調了基於代理的系統在模擬可信的人類行為方面的潛力。正如論文中提出的那樣,生成代理可以以復雜且引人入勝的方式進行交互,形成意見,發起對話,甚至自主計劃和參加活動。這項工作進一步支持了代理機制在 AI 開發中具有廣闊前景的論點。

[

生成代理:人類行為的交互式模擬

人類行為的可信代理可以增強交互式應用程序的能力,從沉浸式環境到用於人際交流的排練空間再到原型製作工具。在本文中,我們介紹了生成代理——模擬可信人類行為的計算軟件代理……

Auto-GPT 可以通過擁抱向異步編程的範式轉變和促進代理間通信,為更高效和動態的問題解決能力開啟新的可能性。結合“生成代理”論文中介紹的架構和交互模式可以導致大型語言模型與計算、交互代理的融合。這種結合有可能徹底改變任務在 AI 框架內的委派和執行方式,並實現更可信的人類行為模擬。代理系統的開發和探索可以極大地促進人工智能應用的發展,為複雜問題提供更強大和動態的解決方案。

結論

總之,圍繞 Auto-GPT 的熱議引發了關於 AI 研究現狀以及公眾理解在推動新興技術炒作中的作用的重要問題。正如我們已經證明的那樣,Auto-GPT 在推理能力方面的局限性、矢量數據庫的過度使用以及代理機制的早期開發表明它遠不是一個實用的解決方案。然而,它已經成功地抓住了公眾的想像力,他們可能對其內部運作缺乏深入的了解。

圍繞 Auto-GPT 的炒作提醒我們,淺薄的理解會導致期望過高,最終導致對 AI 真實能力的扭曲認知。作為一個社會,我們必須警惕質疑圍繞新興技術的敘述,並努力培養批判性思維和知情討論。

也就是說,Auto-GPT 確實為 AI 的未來指明了一個有前途的方向:生成代理系統。在我們前進的過程中,讓我們吸取 Auto-GPT 炒作的教訓,並專注於圍繞 AI 研究培養更細緻、更明智的對話。通過這樣做,我們可以利用生成代理系統的變革力量,繼續突破人工智能能力的界限,塑造一個技術真正造福人類的未來。