首頁 > 科技要聞 > 科技> 正文

GPT-4.5/5 內(nèi)測(cè)版回歸?OpenAI 神秘新模型驚艷網(wǎng)友,另一個(gè)重磅更新即將上線

appso 整合編輯:龔震 發(fā)布于:2024-05-10 17:44

前段時(shí)間,一個(gè)名為 gpt2-chatbot 的神秘大模型一夜冒頭,憑借媲美 GPT-4 的實(shí)力在整個(gè) AI 圈賺足了眼球,甚至被認(rèn)為是 GPT-4.5/5 的內(nèi)測(cè)版。

連 OpenAI CEO Sam Altman 都忍不住下場(chǎng)蹭起了熱度:

我確實(shí)對(duì) gpt 2 情有獨(dú)鐘。

好奇的網(wǎng)友們蜂擁而至,結(jié)果由于人氣太旺,很快該模型就被緊急下架,而最近這款模型再次上線,并且還帶來了一款新的模型:

-Im-a-good-gpt2-chatbot

-Im-also-a-good-gpt2-chatbot

GPT-4.5/5 的內(nèi)測(cè)版?到底什么來頭

新模型的誕生總能激起網(wǎng)友的狂歡,短短幾天,網(wǎng)友已經(jīng)將這兩款模型玩出了花。

網(wǎng)友 @kiieford 給 im-a-good-gpt2-chatbot 出了個(gè)難題,讓它創(chuàng)建一個(gè)對(duì) mp3 文件做出反應(yīng)的 3D 可視化網(wǎng)頁,結(jié)果一次就成功了。

當(dāng)網(wǎng)友讓它分析一張直升機(jī)的符號(hào)照片時(shí),Im-also-a-good-gpt2-chatbot 如同庖丁解牛一般,光速拆解細(xì)節(jié),「看圖說話」的能力堪稱一流。

在同一問題的對(duì)比上,這兩位「選手」的表現(xiàn)可謂是各有千秋。

im-a-good-gpt2-chatbot 不僅對(duì)于給出了詳盡的解答,更是將游戲的機(jī)制和得分情況分析得頭頭是道。而 im-also-a-good-gpt2-chatbot 的回復(fù)簡(jiǎn)潔凝練,直擊要點(diǎn),雖然話不多,但每一句都是精華。

別看 im-also-a-good-gpt2-chatbot 在回答問題時(shí)惜字如金,做起事來卻一點(diǎn)也不含糊。

當(dāng)網(wǎng)友輸入提示詞:Code Flappy Bird game in Python,讓其編寫鳥飛類游戲代碼時(shí),配上幾張精心挑選的 Png 照片,不一會(huì)兒,一個(gè)生動(dòng)的游戲界面便大功告成。

當(dāng) AI 遇上中文問題,這兩個(gè)模型的表現(xiàn)瞬間拉開差距。

im-a-good-gpt2-chatbot 的回復(fù)展現(xiàn)了它對(duì)中文語境的深刻理解,面對(duì)「魯迅打周樹人」這樣的調(diào)侃,它能指出其中的幽默之處。

而 im-also-a-good-gpt2-chatbot 則洋洋灑灑寫了一大堆,強(qiáng)行上價(jià)值的回答仿佛在做閱讀理解。

不過 im-also-a-good-gpt2-chatbot 在編程方面的表現(xiàn)也確實(shí)可圈可點(diǎn)。

網(wǎng)友 @itsandrewgao 要求其編寫一個(gè)方格顏色隨機(jī)變化的康威生命游戲代碼,并且要顯示每一代的活細(xì)胞數(shù)量時(shí),雖說最初的結(jié)果不太理想,但在網(wǎng)友的再次要求下,它能夠自行修復(fù)代碼。

Reddit 網(wǎng)友拋出了一個(gè)棘手的物理問題,此前連 GPT-4 Turbo 也沒能成功解答,而 im-also-a-good-gpt2-chabot 卻給出了正確答案。

總想挖點(diǎn)猛料的網(wǎng)友向 im-a-good-gpt2-chatbot 發(fā)起了靈魂拷問,詢問其是否為 GPT-4.5 時(shí),其回復(fù)道:「我是一個(gè)基于 GPT-4 架構(gòu)的優(yōu)秀聊天機(jī)器人,特別是 GPT-4.5 變體。我所接受的訓(xùn)練數(shù)據(jù)包含直至 2023 年 11 月的信息!

壞消息是 Altman 此前在哈佛大學(xué)演講時(shí)曾明確否認(rèn) gpt2-chatbot 為 GPT-4.5/5,但好消息是,這也意味著 GPT-4.5/5 的性能或許將遠(yuǎn)超我們的想象。

包括 OpenAI 首席運(yùn)營(yíng)官 Brad Lightcap 最近也放出豪言,當(dāng)今的生成式 AI 在一年內(nèi)就會(huì)變得「糟糕得可笑」,言語之間對(duì)即將到來的 GPT-4.5/5 充滿了自信。

即便這兩款模型并非是 GPT-4.5/5,但或許也與 OpenAI 也脫離不了關(guān)系。

無論是幾天前,Altman 疑似發(fā)帖「劇透」:Im-also-a-good-gpt2-chatbot,還是網(wǎng)友 @nanulled 的最新發(fā)現(xiàn),似乎都讓這些模型出自 OpenAI 之手的猜測(cè)再添實(shí)錘。

附上這兩款模型的體驗(yàn)方法:

訪問 http://chat.lmsys.org 并選擇「Arena (battle)」

輸入提示詞并對(duì)響應(yīng)進(jìn)行評(píng)分,檢查聊天框底部的評(píng)分模型

重復(fù)上面步驟,直到找到「im-a-good-gpt2-chatbot」或「im-also-a-good-gpt2-chatbot」OpenAI

最近的大更新,是 AI 搜索

比起捉摸不透的兩款新模型,OpenAI 即將發(fā)布的 AI 搜索引擎其實(shí)更值得期待,這或許也會(huì)給晚些時(shí)候亮相的 GPT-4.5/5 作鋪墊。

最近,據(jù)可靠爆料人@apples_jimmy 透露,OpenAI 將于北京時(shí)間 5 月 10 日發(fā)布 AI 搜索引擎。不過 The Information 提醒,OpenAI 內(nèi)部也還沒完全確定發(fā)布日期,隨時(shí)都有「跳票」的可能。

彭博社則爆料了這款即將發(fā)布的產(chǎn)品的一些使用情況。用戶只需通過自然語言的方式提問,它就會(huì)翻遍維基百科條目和博客文章,給用戶一個(gè)滿意的答案。

它還支持用書面文字和圖像來回答問題。比如你問它該如何更換門把手,不僅會(huì)有文字耐心告訴你一步步怎么做,還可能附上一個(gè)清晰的圖表手把手教你。

目前訪問 OpenAI 官網(wǎng)網(wǎng)址 https://openai.com/,首先出現(xiàn)的便是官網(wǎng)的輪轉(zhuǎn)頁面「Ask ChatGPT Anything」,輸入問題后,即可跳轉(zhuǎn)至 ChatGPT 獲知答案。

昨天國(guó)內(nèi)也有博主 @賽博禪心已經(jīng)搶先體驗(yàn)了一波功能。

例如,在搜索 5 月 7 日蘋果發(fā)布會(huì)的內(nèi)容時(shí),ChatGPT 引用了 4 個(gè)高質(zhì)量的網(wǎng)址信源,答案總結(jié)得井井有條。

但在搜比特幣的價(jià)格時(shí),它的回復(fù)不夠?qū)崟r(shí),并且在其他問題上,中英文的回復(fù)也有點(diǎn)混淆。搜索服務(wù)的內(nèi)核還是 Bing,但響應(yīng)速度比以前快了不少。

圖片來自@賽博禪心

前阿里頂級(jí) AI 科學(xué)家賈揚(yáng)清則對(duì) ChatGPT 的搜索功能贊不絕口。

在同樣體驗(yàn)新功能后,他認(rèn)為這項(xiàng)技術(shù)正在取代那些僅通過調(diào)用傳統(tǒng)搜索并利用大型語言模型(LLM)來總結(jié)結(jié)果的簡(jiǎn)單工具。

他舉例稱,通過詢問「今天 Hacker news 最受歡迎的帖子說了什么」這樣的問題時(shí),就能看出 ChatGPT 新搜索功能的獨(dú)到之處。

Google 會(huì)甩給你一堆鏈接,讓你自己慢慢翻;Copilot 努力了,但結(jié)果有些跑偏;Gemini 會(huì)禮貌地教你一步步訪問網(wǎng)址;Perplexity 給不出足夠的信息量,而 ChatGPT 呢,不僅真正訪問了實(shí)際網(wǎng)址,還直接讓答案觸手可及。

傳統(tǒng)搜索引擎雖然是信息檢索的利器,但一串串雜亂無章的網(wǎng)址列表既費(fèi)時(shí)又費(fèi)力。在這個(gè)信息爆炸的時(shí)代,我們對(duì)搜索的期待早已超越了簡(jiǎn)單的「搜索」二字。

從 Perplexity 自稱的「世界上首個(gè)答案引擎」就可以看出,AI 時(shí)代下的我們,需要的只是一步即達(dá)的答案,而不是略顯繁瑣的「搜索」。

這是諸如 Perplexity 等工具得以在極短的時(shí)間內(nèi)聲名鵲起,甚至叫板 Google 的底氣所在,同樣也是 ChatGPT 碾壓實(shí)力備受賈揚(yáng)清青睞的原因所在。

實(shí)際上,沒有人比 OpenAI 更懂怎么狙擊競(jìng)爭(zhēng)對(duì)手了,這次也不例外,瞄準(zhǔn)的或許依然還是那個(gè)熟悉的「倒霉蛋」—— Google 。

今年 2 月,Google 推出攢了許久的終極 AI 大招——Gemini 1.5 Pro,這一炸裂性的頭條新聞濺起的水花,不到幾個(gè)小時(shí)就被 OpenAI 的 Sora 狠狠壓下。

而最近彭博社報(bào)道稱,OpenAI 目前正在組建新的搜索團(tuán)隊(duì),平時(shí)也沒少往 Google 家里「撬墻角」。

與此同時(shí),OpenAI 即將推出的 AI 搜索引擎也選了個(gè)好時(shí)機(jī),有意無意地與下周二即將召開的 Google I/O 大會(huì)撞了個(gè)滿懷,也讓這場(chǎng)發(fā)布會(huì)尚未開始就平添了幾分火藥味。

不過,OpenAI 的這些小動(dòng)作似乎并未給 Google CEO 皮查伊造成太多壓力。

昨天在接受彭博社的采訪時(shí),他還淡定回應(yīng)「我們不是第一家進(jìn)行搜索、第一家提供電子郵件的公司,我們也不是第一家開發(fā)瀏覽器的公司!

言外之意就是,別急,好戲還在后頭。

每個(gè)人面臨的挑戰(zhàn)和機(jī)遇是:在一個(gè)存在大量合成內(nèi)容的世界中,你如何了解什么是客觀和真實(shí)的?我認(rèn)為這將定義未來十年搜索的一部分。

當(dāng)然,就像一夜橫空出世的 Sora 將 Runway、Pika 打得毫無招架之力,當(dāng) OpenAI 與 Google 就 AI 搜索斗得天昏地暗,我更好奇的是,角落里的 Perplexity 能否不被這場(chǎng)風(fēng)暴「殃及池魚」。

而距離這個(gè)謎底的揭曉,或許已經(jīng)不到 24 個(gè)小時(shí)了。

文章來源:APPSO

gpt2-chatbot    GPT-4   5/5    AI搜索
appso

網(wǎng)友評(píng)論

聚超值•精選

手機(jī) 筆記本 影像 硬件 家居 商用 企業(yè) 出行 未來
二維碼 回到頂部