或許是前段時間風頭太盛,周末時,OpenAI 靜悄悄發(fā)布了新的研究作品:Swarm。一反之前的架勢,這個新作只在官網的 Cookbook 和 Github 發(fā)布,官推都沒有多講。 除了非常安靜和低調,開發(fā)人員還反復給自己疊甲:這只是一個實驗性質的框架,只作為分享和教育用途。官方不質保,實用需謹慎! 明明已經這么低調,一出來還是被碰瓷了。 什么是 Swarm? Swarm 旨在探索輕量級、可擴展、可定制的多代理協(xié)作模式。OpenAI 的研究人員,提出了「routine」和「handoffs」概念,用來表達 agent 之間的任務傳遞。 然而 Swarm 才發(fā)布一天,麻煩就找上門來:一個二十多歲的開發(fā)者 Kye Gomez 發(fā)推稱,這個新作從名字到框架,全都是抄襲他的創(chuàng)業(yè)項目 Swarms。 這條控訴吸引了超過 20 萬的圍觀,不過,圍觀群眾都很冷靜,要求 Kye 提供更明確的證據,并且質疑他提出的訴求:「除非 OpenAI 投資我們」,這什么東西啊? 很快就有網友翻出他的碰瓷前科。而且,從兩邊在 Github 上發(fā)布的 README 文檔來看,顯然也是 OpenAI 更靠譜一點。 我把文檔送進了 ChatGPT,用最新的 o1 做了一下分析,OpenAI 提出了更詳實和具體的想法。 至于說項目重名和一些常用指令重合,比如.run()——這就像是有人說自己的數學考卷被抄襲了,因為兩邊的答題框里都有個「解」字 。 OpenAI 的 Swarm 框架里,重點梳理了在多代理模式里的各種成分,并且提出了兩個關鍵概念:例程 (routines) 和交接 (handoffs),還提供了很多便于理解的例子。 例程可以把它理解為由不同步驟組成起來的一套「基本操作」,比如,你搭建了一個購物助理,那么你就可以規(guī)定一套流程作為例程。 但是一個 agent 能做的事,再多也是有限的。更何況大語言模型本身,多多少少會出幻覺。所以需要不同的 agent、不同的 routine 之間有所交接。 就像一場接力跑,一個選手跑完一段,就要交接到下一個選手手上,而且要保證平穩(wěn),不能掉在地上。 這些才是本次發(fā)布里 OpenAI 重點關注的部分;蛟S說不上是什么驚為天人的大發(fā)現(xiàn),但硬說抄襲,也是有點碰瓷了——非要追根溯源,那得倒回幾十年前。 多智能體最擅長的,竟然是打游戲 OpenAI 并不是才開始對多智能體協(xié)作發(fā)生興趣的,早在 2018 年,就有過不錯的表現(xiàn)——在 Dota 2 職業(yè)比賽上,擊敗了資深的人類玩家。 游戲是一個天然適合用來測試多智能體的土壤,不同的角色,有不同的技能;面對不同的對手,要有不同的策略,總之,想要贏下一局游戲,勢必要協(xié)調各個角色,并且組織好它們之間的協(xié)作能力。 想想你打王者碰到豬隊友時有多氣,就知道這個難度了。 當時 OpenAI Five 涉及到的技術構件包括神經網絡、自訓練、強化學習等,沒有時下流行的大語言模型,主要是用來試驗多智能體協(xié)作。 甚至,那個時候每個英雄各自背后的神經網絡,并不互相溝通,而是有一個負責總控的超參數,來協(xié)調每一個英雄(主要是背后的神經網絡)的表現(xiàn)。 再往深了講就有點太深了,總之,那幾年的經歷,讓 OpenAI 連續(xù)三年打贏了幾個 Dota2 的大賽,也在多智能體協(xié)作方面頗有收獲。 到了 2019 年,DeepMind 開發(fā)的 AlphaStar 在《星際爭霸 2》中,水平超過了 99.8%的人類玩家。 在星際里,有人族、神族和蟲族三個派系,每個派系都有多個可供操作的建筑、兵種,每局游戲也都需要經歷資源采集、科技發(fā)展和實時戰(zhàn)斗等幾個流程。 當時 DeepMind 發(fā)表論文時就提到,游戲是一個多智能體協(xié)作的任務,每個玩家需要控制許多單位,共同實現(xiàn)目標。 DeepMind 所設計的 agent,每分鐘操作數約為 180 次,大概等同于中級玩家。當時他們的想法是:智能體要盡可能地學習人類玩家的游戲操作,然后超越人類。 這樣的「類人」思路,甚至可以追溯到更久之前:早在 1972 年,卡爾·休伊特(Carl Hewitt)就提出了 Actor Model(行動者模型),這是并發(fā)計算的概念模型。演員模型提出了獨立計算實體(agent)可以通過消息傳遞進行通信的概念,為智能體之間的交互奠定了理論基礎。 到了九十年代和千禧年初,agent 就更加明確的,被視為能夠自主行動、決策的「賽博實體」,并且有了基于智能體信念、意圖進行決策和規(guī)劃的研究,BDI 模型。 等到了大語言模型橫空出世之后,多智能體的交互、決策溝通,從原來的黑盒,變得更容易轉化成自然語言。 智能體之間,也可以通過語言來討論、協(xié)作,特別是在決策情境中,不同的智能體之間能夠「有商有量」。 之前我們介紹過,也是在 Minecraft,一款沙盒游戲里——不得不說,多智能體實在是太擅長打游戲了。 在游戲里,不同的智能體可以直接對話來完成分工、資源互通和任務傳遞。大語言模型的推理和記憶能力,都能更有效地為多智能體的行動提供支援。 而 OpenAI 不就在于有厲害的模型嗎——年初時,他們借由 ChatGPT 灰度測試過,在對話框內,可以召喚其他 GPT 插件,也算是一種多智能體協(xié)作的「平替版」。 只是效果著實不咋地,嘗試了一下 Capcut 的插件,一直鬼打墻的跳轉不成功(注:Capcut 是剪映的海外版)。 可以說,這一次的 Swarm 是 OpenAI 探索充分調動自己的優(yōu)勢——強大的基座模型——再進一步摸索出一個多智能體的工作流程框架。 好消息是,在從 OpenAI 變得越來越「吝嗇」之后。這次 Swarm 倒是開源出來了。大語言模型讓多智能體系統(tǒng)能夠以更加自然的方式與人類互動。相信在未來,這種交互絕不僅限于簡單的對話,而是會更多的提高生產力。 本文來源:Appso |
原創(chuàng)欄目
IT百科
網友評論
聚超值•精選