太平洋科技要聞

首頁 > 科技要聞 > 科技> 正文

GPT-4.5/5 內(nèi)測(cè)版回歸？OpenAI 神秘新模型驚艷網(wǎng)友，另一個(gè)重磅更新即將上線

appso 整合編輯：龔震發(fā)布于：2024-05-10 17:44

前段時(shí)間，一個(gè)名為 gpt2-chatbot 的神秘大模型一夜冒頭，憑借媲美 GPT-4 的實(shí)力在整個(gè) AI 圈賺足了眼球，甚至被認(rèn)為是 GPT-4.5/5 的內(nèi)測(cè)版。

連 OpenAI CEO Sam Altman 都忍不住下場(chǎng)蹭起了熱度：

我確實(shí)對(duì) gpt 2 情有獨(dú)鐘。

好奇的網(wǎng)友們蜂擁而至，結(jié)果由于人氣太旺，很快該模型就被緊急下架，而最近這款模型再次上線，并且還帶來了一款新的模型：

-Im-a-good-gpt2-chatbot

-Im-also-a-good-gpt2-chatbot

GPT-4.5/5 的內(nèi)測(cè)版？到底什么來頭

新模型的誕生總能激起網(wǎng)友的狂歡，短短幾天，網(wǎng)友已經(jīng)將這兩款模型玩出了花。

網(wǎng)友 @kiieford 給 im-a-good-gpt2-chatbot 出了個(gè)難題，讓它創(chuàng)建一個(gè)對(duì) mp3 文件做出反應(yīng)的 3D 可視化網(wǎng)頁，結(jié)果一次就成功了。

當(dāng)網(wǎng)友讓它分析一張直升機(jī)的符號(hào)照片時(shí)，Im-also-a-good-gpt2-chatbot 如同庖丁解牛一般，光速拆解細(xì)節(jié)，「看圖說話」的能力堪稱一流。

在同一問題的對(duì)比上，這兩位「選手」的表現(xiàn)可謂是各有千秋。

im-a-good-gpt2-chatbot 不僅對(duì)于給出了詳盡的解答，更是將游戲的機(jī)制和得分情況分析得頭頭是道。而 im-also-a-good-gpt2-chatbot 的回復(fù)簡(jiǎn)潔凝練，直擊要點(diǎn)，雖然話不多，但每一句都是精華。

別看 im-also-a-good-gpt2-chatbot 在回答問題時(shí)惜字如金，做起事來卻一點(diǎn)也不含糊。

當(dāng)網(wǎng)友輸入提示詞：Code Flappy Bird game in Python，讓其編寫鳥飛類游戲代碼時(shí)，配上幾張精心挑選的 Png 照片，不一會(huì)兒，一個(gè)生動(dòng)的游戲界面便大功告成。

當(dāng) AI 遇上中文問題，這兩個(gè)模型的表現(xiàn)瞬間拉開差距。

im-a-good-gpt2-chatbot 的回復(fù)展現(xiàn)了它對(duì)中文語境的深刻理解，面對(duì)「魯迅打周樹人」這樣的調(diào)侃，它能指出其中的幽默之處。

而 im-also-a-good-gpt2-chatbot 則洋洋灑灑寫了一大堆，強(qiáng)行上價(jià)值的回答仿佛在做閱讀理解。

不過 im-also-a-good-gpt2-chatbot 在編程方面的表現(xiàn)也確實(shí)可圈可點(diǎn)。

網(wǎng)友 @itsandrewgao 要求其編寫一個(gè)方格顏色隨機(jī)變化的康威生命游戲代碼，并且要顯示每一代的活細(xì)胞數(shù)量時(shí)，雖說最初的結(jié)果不太理想，但在網(wǎng)友的再次要求下，它能夠自行修復(fù)代碼。

Reddit 網(wǎng)友拋出了一個(gè)棘手的物理問題，此前連 GPT-4 Turbo 也沒能成功解答，而 im-also-a-good-gpt2-chabot 卻給出了正確答案。

總想挖點(diǎn)猛料的網(wǎng)友向 im-a-good-gpt2-chatbot 發(fā)起了靈魂拷問，詢問其是否為 GPT-4.5 時(shí)，其回復(fù)道：「我是一個(gè)基于 GPT-4 架構(gòu)的優(yōu)秀聊天機(jī)器人，特別是 GPT-4.5 變體。我所接受的訓(xùn)練數(shù)據(jù)包含直至 2023 年 11 月的信息�！�

壞消息是 Altman 此前在哈佛大學(xué)演講時(shí)曾明確否認(rèn) gpt2-chatbot 為 GPT-4.5/5，但好消息是，這也意味著 GPT-4.5/5 的性能或許將遠(yuǎn)超我們的想象。

包括 OpenAI 首席運(yùn)營(yíng)官 Brad Lightcap 最近也放出豪言，當(dāng)今的生成式 AI 在一年內(nèi)就會(huì)變得「糟糕得可笑」，言語之間對(duì)即將到來的 GPT-4.5/5 充滿了自信。

即便這兩款模型并非是 GPT-4.5/5，但或許也與 OpenAI 也脫離不了關(guān)系。

無論是幾天前，Altman 疑似發(fā)帖「劇透」：Im-also-a-good-gpt2-chatbot，還是網(wǎng)友 @nanulled 的最新發(fā)現(xiàn)，似乎都讓這些模型出自 OpenAI 之手的猜測(cè)再添實(shí)錘。

附上這兩款模型的體驗(yàn)方法：

訪問 http://chat.lmsys.org 并選擇「Arena (battle)」

輸入提示詞并對(duì)響應(yīng)進(jìn)行評(píng)分，檢查聊天框底部的評(píng)分模型

重復(fù)上面步驟，直到找到「im-a-good-gpt2-chatbot」或「im-also-a-good-gpt2-chatbot」OpenAI

最近的大更新，是 AI 搜索

比起捉摸不透的兩款新模型，OpenAI 即將發(fā)布的 AI 搜索引擎其實(shí)更值得期待，這或許也會(huì)給晚些時(shí)候亮相的 GPT-4.5/5 作鋪墊。

最近，據(jù)可靠爆料人@apples_jimmy 透露，OpenAI 將于北京時(shí)間 5 月 10 日發(fā)布 AI 搜索引擎。不過 The Information 提醒，OpenAI 內(nèi)部也還沒完全確定發(fā)布日期，隨時(shí)都有「跳票」的可能。

彭博社則爆料了這款即將發(fā)布的產(chǎn)品的一些使用情況。用戶只需通過自然語言的方式提問，它就會(huì)翻遍維基百科條目和博客文章，給用戶一個(gè)滿意的答案。

它還支持用書面文字和圖像來回答問題。比如你問它該如何更換門把手，不僅會(huì)有文字耐心告訴你一步步怎么做，還可能附上一個(gè)清晰的圖表手把手教你。

目前訪問 OpenAI 官網(wǎng)網(wǎng)址 https://openai.com/，首先出現(xiàn)的便是官網(wǎng)的輪轉(zhuǎn)頁面「Ask ChatGPT Anything」，輸入問題后，即可跳轉(zhuǎn)至 ChatGPT 獲知答案。

昨天國(guó)內(nèi)也有博主 @賽博禪心已經(jīng)搶先體驗(yàn)了一波功能。

例如，在搜索 5 月 7 日蘋果發(fā)布會(huì)的內(nèi)容時(shí)，ChatGPT 引用了 4 個(gè)高質(zhì)量的網(wǎng)址信源，答案總結(jié)得井井有條。

但在搜比特幣的價(jià)格時(shí)，它的回復(fù)不夠?qū)崟r(shí)，并且在其他問題上，中英文的回復(fù)也有點(diǎn)混淆。搜索服務(wù)的內(nèi)核還是 Bing，但響應(yīng)速度比以前快了不少。

圖片來自@賽博禪心

前阿里頂級(jí) AI 科學(xué)家賈揚(yáng)清則對(duì) ChatGPT 的搜索功能贊不絕口。

在同樣體驗(yàn)新功能后，他認(rèn)為這項(xiàng)技術(shù)正在取代那些僅通過調(diào)用傳統(tǒng)搜索并利用大型語言模型（LLM）來總結(jié)結(jié)果的簡(jiǎn)單工具。

他舉例稱，通過詢問「今天 Hacker news 最受歡迎的帖子說了什么」這樣的問題時(shí)，就能看出 ChatGPT 新搜索功能的獨(dú)到之處。

Google 會(huì)甩給你一堆鏈接，讓你自己慢慢翻；Copilot 努力了，但結(jié)果有些跑偏；Gemini 會(huì)禮貌地教你一步步訪問網(wǎng)址；Perplexity 給不出足夠的信息量，而 ChatGPT 呢，不僅真正訪問了實(shí)際網(wǎng)址，還直接讓答案觸手可及。

傳統(tǒng)搜索引擎雖然是信息檢索的利器，但一串串雜亂無章的網(wǎng)址列表既費(fèi)時(shí)又費(fèi)力。在這個(gè)信息爆炸的時(shí)代，我們對(duì)搜索的期待早已超越了簡(jiǎn)單的「搜索」二字。

從 Perplexity 自稱的「世界上首個(gè)答案引擎」就可以看出，AI 時(shí)代下的我們，需要的只是一步即達(dá)的答案，而不是略顯繁瑣的「搜索」。

這是諸如 Perplexity 等工具得以在極短的時(shí)間內(nèi)聲名鵲起，甚至叫板 Google 的底氣所在，同樣也是 ChatGPT 碾壓實(shí)力備受賈揚(yáng)清青睞的原因所在。

實(shí)際上，沒有人比 OpenAI 更懂怎么狙擊競(jìng)爭(zhēng)對(duì)手了，這次也不例外，瞄準(zhǔn)的或許依然還是那個(gè)熟悉的「倒霉蛋」—— Google 。

今年 2 月，Google 推出攢了許久的終極 AI 大招——Gemini 1.5 Pro，這一炸裂性的頭條新聞濺起的水花，不到幾個(gè)小時(shí)就被 OpenAI 的 Sora 狠狠壓下。

而最近彭博社報(bào)道稱，OpenAI 目前正在組建新的搜索團(tuán)隊(duì)，平時(shí)也沒少往 Google 家里「撬墻角」。

與此同時(shí)，OpenAI 即將推出的 AI 搜索引擎也選了個(gè)好時(shí)機(jī)，有意無意地與下周二即將召開的 Google I/O 大會(huì)撞了個(gè)滿懷，也讓這場(chǎng)發(fā)布會(huì)尚未開始就平添了幾分火藥味。

不過，OpenAI 的這些小動(dòng)作似乎并未給 Google CEO 皮查伊造成太多壓力。

昨天在接受彭博社的采訪時(shí)，他還淡定回應(yīng)「我們不是第一家進(jìn)行搜索、第一家提供電子郵件的公司，我們也不是第一家開發(fā)瀏覽器的公司�！�

言外之意就是，別急，好戲還在后頭。

每個(gè)人面臨的挑戰(zhàn)和機(jī)遇是：在一個(gè)存在大量合成內(nèi)容的世界中，你如何了解什么是客觀和真實(shí)的？我認(rèn)為這將定義未來十年搜索的一部分。

當(dāng)然，就像一夜橫空出世的 Sora 將 Runway、Pika 打得毫無招架之力，當(dāng) OpenAI 與 Google 就 AI 搜索斗得天昏地暗，我更好奇的是，角落里的 Perplexity 能否不被這場(chǎng)風(fēng)暴「殃及池魚」。