首頁(yè) > 科技要聞 > 科技> 正文

零一萬(wàn)物發(fā)布旗艦預(yù)訓(xùn)練模型,李開(kāi)復(fù)回應(yīng)AI六小虎困境傳言:融資、芯片都不是問(wèn)題

騰訊科技 整合編輯:太平洋科技 發(fā)布于:2024-10-17 17:03

最近,自媒體關(guān)于國(guó)內(nèi)的“AI六小虎”有一些負(fù)面?zhèn)餮浴硯准曳艞夘A(yù)訓(xùn)練,并指出零一萬(wàn)物就是其中一家,對(duì)此,零一萬(wàn)物創(chuàng)始人李開(kāi)復(fù)曾在上周親自發(fā)聲辟謠。

10月16日,零一萬(wàn)物正式發(fā)布了新的預(yù)訓(xùn)練模型 Yi-Lightning。

在 Yi-Lightning的發(fā)布會(huì)上,李開(kāi)復(fù)提到:“據(jù)我了解,目前“AI六小虎”在融資方面都有足夠的資金支持,可以承擔(dān)起預(yù)訓(xùn)練模型的運(yùn)行成本。因此,只要這些公司能夠吸引到足夠的優(yōu)秀人才,并有決心進(jìn)行預(yù)訓(xùn)練模型的開(kāi)發(fā),資金和芯片資源都不會(huì)成為障礙。盡管這樣的公司可能會(huì)越來(lái)越少,但只要他們能夠持續(xù)投入,中國(guó)大模型公司就有可能在全球范圍內(nèi)取得領(lǐng)先地位!

零一萬(wàn)物發(fā)布的最新旗艦?zāi)P?Yi-Lightning,與零一萬(wàn)物上半年發(fā)布的千億參數(shù)模型 Yi-Large 相比,在性能更進(jìn)一步的前提下,推理速度方面有著極大提升。根據(jù)官方發(fā)布的評(píng)測(cè)數(shù)據(jù)顯示,在 8xH100 算力基礎(chǔ)下,以同樣的任務(wù)規(guī)模進(jìn)行測(cè)試,Yi-Lightning 的首包時(shí)間(從接收到任務(wù)請(qǐng)求到系統(tǒng)開(kāi)始輸出響應(yīng)結(jié)果之間的時(shí)間)僅為 Yi-Large 的一半,最高生成速度也提升了近四成,實(shí)現(xiàn)了旗艦?zāi)P偷男阅苌?jí)。

在國(guó)際權(quán)威盲測(cè)榜單 LMSYS 上,Yi-Lightning 排名第六,暫時(shí)位列GPT-4o-2024-05-13、Anthropic Claude 3.5 Sonnet之前。

圖注:國(guó)際權(quán)威盲測(cè)榜單LMSYS 中,大語(yǔ)言模型綜合能力排名

根據(jù)李開(kāi)復(fù)介紹,模型性能與推理速度的提升,一方面因?yàn)榱阋蝗f(wàn)物重視AI Infra能力的提升,2024年以來(lái),中國(guó)大模型行業(yè)從狂奔進(jìn)入到了“長(zhǎng)跑階段”,而大模型公司的核心競(jìng)爭(zhēng)力模型+AI 基礎(chǔ)設(shè)施+應(yīng)用,缺一不可。

另外一方面,Yi-Lightning更新了模型架構(gòu),不再應(yīng)用稠密模型架構(gòu),而是采用了 Mixture of Experts(MoE)混合專(zhuān)家模型架構(gòu),并在模型訓(xùn)練過(guò)程中做了新的嘗試:

1、混合注意力機(jī)制:為了處理長(zhǎng)序列數(shù)據(jù),Yi-Lightning 采用了混合注意力機(jī)制,這種機(jī)制結(jié)合了全注意力和滑動(dòng)窗口注意力,以平衡性能和計(jì)算資源消耗。此外,引入了跨層注意力(CLA),允許模型在不同層次間共享鍵和值,減少存儲(chǔ)需求,提高推理效率。

2、動(dòng)態(tài) Top-P 路由:Yi-Lightning 采用了動(dòng)態(tài) Top-P 路由機(jī)制,這種機(jī)制可以根據(jù)任務(wù)難度自動(dòng)選擇最合適的專(zhuān)家網(wǎng)絡(luò)組合,與傳統(tǒng)的 Top-K 路由相比,它更靈活,能夠平衡推理成本和模型性能。

3、多階段訓(xùn)練:Yi-Lightning 的訓(xùn)練過(guò)程采用了多階段訓(xùn)練模式,前期注重?cái)?shù)據(jù)多樣性,后期側(cè)重于更豐富、知識(shí)性更強(qiáng)的數(shù)據(jù)。這種訓(xùn)練方法有助于模型吸收不同階段的知識(shí),并通過(guò)調(diào)整 batch size 和學(xué)習(xí)率(LR)來(lái)保證訓(xùn)練速度和穩(wěn)定性。

在發(fā)布新模型的同時(shí),零一萬(wàn)物同時(shí)也發(fā)布了面向ToB市場(chǎng)的首款產(chǎn)品——AI 2.0數(shù)字人,為零售和電商場(chǎng)景設(shè)計(jì),利用最新的Yi Lightning旗艦?zāi)P吞峁┬袠I(yè)解決方案;赮i Lightning,構(gòu)建了一套包括角色、聲音和電商話(huà)術(shù)的完整模型體系。

針對(duì)于行業(yè)長(zhǎng)期熱議的大模型公司并沒(méi)有建立起真正的PMF問(wèn)題,李開(kāi)復(fù)進(jìn)一步強(qiáng)調(diào),核心在于基礎(chǔ)模型能力需要真正強(qiáng)大及大模型成本還不足夠低。

“我們認(rèn)為,人工智能(AI)時(shí)代的到來(lái)也將使現(xiàn)有的應(yīng)用再次經(jīng)歷變革,轉(zhuǎn)變?yōu)榛贏I的新形態(tài)應(yīng)用。然而,盡管我們已經(jīng)討論了一年,這些應(yīng)用的普及似乎還遠(yuǎn)未到來(lái)。目前,最賺錢(qián)的實(shí)際上是像英偉達(dá)這樣的芯片公司,而非應(yīng)用公司!

此外,李開(kāi)復(fù)強(qiáng)調(diào),要激活一個(gè)健康的生態(tài)系統(tǒng),關(guān)鍵在于擁有頂級(jí)的模型,并且這些模型的價(jià)格要足夠低,以促進(jìn)應(yīng)用的發(fā)展。如果模型太貴,可能會(huì)導(dǎo)致應(yīng)用開(kāi)發(fā)公司破產(chǎn)。

關(guān)鍵在于,如果好的模型價(jià)格過(guò)高,應(yīng)用就無(wú)法迅速普及,也就無(wú)法實(shí)現(xiàn)普惠。我們今天發(fā)布的模型,希望能夠讓我們更接近這一愿景。”

李開(kāi)復(fù)所提到的大模型成本問(wèn)題,確實(shí)大模型邁向下一步需要解決的最重要問(wèn)題之一,這里包含兩個(gè)方面:首先,對(duì)于大模型企業(yè)來(lái)說(shuō),需要不斷迭代更優(yōu)質(zhì)的模型,提高核心競(jìng)爭(zhēng)力,模型迭代速度很快,每個(gè)模型能夠給企業(yè)創(chuàng)造營(yíng)收的時(shí)間窗口可能只有一年左右,甚至更短。這對(duì)模型創(chuàng)業(yè)企業(yè)的商業(yè)模式挑戰(zhàn)很大;

另外一方面,對(duì)于使用大模型的企業(yè)來(lái)說(shuō),如果采用性能最強(qiáng)大的基座模型,推理成本居高不下,這也是需要解決的巨大問(wèn)題。

只有模型能力和成本問(wèn)題能夠被逐步解決,基于AI的商業(yè)生態(tài)才能真正健康地發(fā)展。

在發(fā)布會(huì)上,李開(kāi)復(fù)也與包括騰訊科技在內(nèi)的媒體進(jìn)行了深度溝通,并正面回復(fù)了關(guān)于大模型領(lǐng)域的成本 、競(jìng)爭(zhēng)等重要問(wèn)題,以下為內(nèi)容實(shí)錄:

Q:此前有消息稱(chēng)AI方面的六小虎,某幾家放棄了預(yù)訓(xùn)練,開(kāi)復(fù)博士已辟謠了,但站在行業(yè)的角度請(qǐng)?jiān)u估逐步放棄預(yù)訓(xùn)練模型將是行業(yè)整個(gè)趨勢(shì)嗎?

李開(kāi)復(fù):我覺(jué)得做好預(yù)訓(xùn)練模型是一個(gè)技術(shù)活,而且是要非常多有才華的人在一起工作,慢工出細(xì)活,需要有懂芯片的人,懂推理的人,懂基礎(chǔ)架構(gòu)的人,懂模型的人,有很好的算法同學(xué),一起做出來(lái)。

如果一個(gè)公司能有幸擁有這么多優(yōu)秀的人才,能夠跨領(lǐng)域的合作,那我相信中國(guó)是絕對(duì)可以做出世界排名前十的預(yù)訓(xùn)練的通用模型,但不是每家公司都可以做這件事情,做這件事情的成本也比較高,以后有可能會(huì)越來(lái)越少的大模型公司訓(xùn)練做預(yù)訓(xùn)練。不過(guò)據(jù)我所知,這六家公司融資額度都是夠的,我們做預(yù)訓(xùn)練的production run,訓(xùn)練一次三四百萬(wàn)美金,這個(gè)錢(qián)也是頭部公司都付得起,我覺(jué)得中國(guó)的六家大模型公司只要有夠好的人才,想做預(yù)訓(xùn)練的決心,融資額跟芯片都不會(huì)是問(wèn)題的。

Q:OpenAI的o1發(fā)布后,很多人認(rèn)為,從技術(shù)上會(huì)帶來(lái)新的范式。這對(duì)初創(chuàng)公司來(lái)說(shuō)會(huì)有哪些影響?

李開(kāi)復(fù):我剛從美國(guó)回來(lái),跟OpenAI的人員也有溝通,他們跟我分享的是公司內(nèi)部還有一些好東西,但是他們不急拿出來(lái),因?yàn)樗麄冾I(lǐng)先行業(yè)足夠多,到了一定的業(yè)務(wù)節(jié)點(diǎn)才釋放出來(lái),這是他們能做而別人不能做。OpenAI o1 雖然隱藏了所有中間的思考狀態(tài),但是很多人還是在網(wǎng)上開(kāi)始猜它怎么做,我們認(rèn)為有一些揣測(cè)還是比較靠譜,我覺(jué)得五個(gè)月以后應(yīng)該也有不少類(lèi)似o1 模型的能力出現(xiàn)在各個(gè)模型公司,包括零一萬(wàn)物。

o1的思考模式是把之前只在預(yù)訓(xùn)練中 scaling (規(guī)模定律)的趨勢(shì)擴(kuò)展到了推理的時(shí)候,這件事情對(duì)行業(yè)是最大的認(rèn)知改變。過(guò)去大家覺(jué)得誰(shuí)預(yù)訓(xùn)練做好就夠了,慢慢大家發(fā)現(xiàn)后訓(xùn)練SFT和強(qiáng)化訓(xùn)練都是非常重要。

所以零一萬(wàn)物的團(tuán)隊(duì)剛開(kāi)始做的主要是專(zhuān)注預(yù)訓(xùn)練,之后又有很多很厲害的人加入,幫我們把Posttrain(后訓(xùn)練)也做出來(lái),現(xiàn)在看來(lái)推理也很重要,一年半以前大家覺(jué)得大模型最厲害的地方就是預(yù)訓(xùn)練,一年以后發(fā)現(xiàn)后訓(xùn)練也是同樣重要,這感謝OpenAI點(diǎn)醒我們這一點(diǎn),現(xiàn)在我相信很多中美公司都在往o1 方向狂奔。

Q:李開(kāi)復(fù)博士之前曾表示不會(huì)從事虧損的To B業(yè)務(wù)。然而,在最近的發(fā)布會(huì)上,他首次公布了相關(guān)的產(chǎn)品矩陣,這似乎表明公司正在嘗試更深入地探索To B市場(chǎng)。這是否意味著零一萬(wàn)物已經(jīng)找到了解決AI 1.0時(shí)代SaaS行業(yè)普遍面臨的低利潤(rùn)和虧損問(wèn)題的方法?

李開(kāi)復(fù):我們特別重視給每一個(gè)用戶(hù)提供價(jià)值,所以我們不會(huì)去說(shuō)有模型,你要拿來(lái)做什么,我賣(mài)給你,你先給錢(qián),這樣對(duì)用戶(hù)是不會(huì)滿(mǎn)足的。另外一種常見(jiàn)的做法,就是到企業(yè)里,企業(yè)說(shuō)我要做客服,模型賣(mài)給我,怎么做客服我不會(huì)做,你幫我做,這就成為和AI1.0時(shí)代一樣的可以稱(chēng)為系統(tǒng)集成型的AI,也就是說(shuō)賣(mài)模型給你,先幫你把客服應(yīng)用做好,這樣的情況下很難有利潤(rùn),之前我說(shuō)如果做一單賠一單的to B,零一萬(wàn)物寧可不做,這句話(huà)我們并沒(méi)有改變。

我們剛剛發(fā)布的AI 2.0數(shù)字人解決方案不會(huì)做一單賠一單,因?yàn)樗菍?zhuān)注到用戶(hù)重大的痛點(diǎn)需求和盈利點(diǎn),也就是說(shuō)一個(gè)店長(zhǎng)或KOL平時(shí)做一次直播浪費(fèi)最重要的資源,就是他的時(shí)間,而且這個(gè)時(shí)間就算做一小時(shí)的直播能賺到一千塊錢(qián),也就是一千塊錢(qián),但如果用數(shù)字人直播就不是一小時(shí)了,可能可以做一千個(gè)小時(shí),哪怕每一個(gè)小時(shí)只能賺一半的錢(qián),一千個(gè)小時(shí)還是可以賺五百倍的錢(qián),這樣的賬就很好算了。如果真的能把數(shù)字人做到端到端,只要輸入公司內(nèi)部的東西,這次減價(jià)的,選一個(gè)形象、聲音按一個(gè)鈕就開(kāi)始百錄甚至千錄的直播,等于你是賣(mài)給這個(gè)企業(yè)一個(gè)印鈔機(jī),印鈔機(jī)要收租賃費(fèi)就是可行的了。除了直播以外,我們的AI 2.0數(shù)字人解決方案已經(jīng)跑通了更多業(yè)務(wù)場(chǎng)景,比如AI伴侶、IP形象、辦公會(huì)議等等。

我們繼續(xù)執(zhí)行模應(yīng)一體戰(zhàn)略,將Yi-Lightning模型能力與數(shù)字人解決方案結(jié)合,不斷迭代產(chǎn)品,后續(xù)會(huì)解鎖更多業(yè)務(wù)場(chǎng)景。

回到國(guó)內(nèi)的SaaS的問(wèn)題,國(guó)內(nèi)現(xiàn)在很難說(shuō)到SaaS,整個(gè)收費(fèi)模式和商業(yè)模式在美國(guó)走通了,但國(guó)內(nèi)還是一直有很大的問(wèn)題。但也有一些行業(yè)可以走通SaaS,SaaS按使用收費(fèi),也可以訂閱,按照每個(gè)月收費(fèi),也可以用分成,這些模式都可以綜合稱(chēng)為比較好的商業(yè)模式,因?yàn)樗皇且淮涡再u(mài)掉,像一個(gè)項(xiàng)目制的公司幫你做一個(gè)客服賣(mài)給你,你付錢(qián)就走了,以后沒(méi)有錢(qián)可以收了,而是可以持續(xù)收費(fèi)。剛才講的模式,無(wú)論分成、訂閱的SaaS模式才是可持續(xù)的商業(yè)模式,今天我們并沒(méi)有看到一個(gè)普遍被接受的SaaS模式的存在。所以在國(guó)內(nèi),我們大模型to B相對(duì)于AI 1.0時(shí)代有不同的打法,首要任務(wù)就是要尋找少數(shù)能夠按使用情況收費(fèi)的方法,而不是項(xiàng)目定制的方法,能得到比較高利潤(rùn)率的訂單再去做。

整體來(lái)看,零一萬(wàn)物 ToB 整體解決方案會(huì)采取“一橫一縱”的打法。和Yi-Large相比,Yi-lightning的模型性能又有大幅提升,作為國(guó)際 SOTA 的基座模型,他們本身就具備著出色的泛化性,再加上零一萬(wàn)物自身?yè)碛泻軓?qiáng)大的SFT(監(jiān)督學(xué)習(xí))能力。這些技術(shù)能力使得我們的團(tuán)隊(duì)能夠先將單個(gè)行業(yè)做深做透,進(jìn)而以自身技術(shù)能力和行業(yè)積累為基礎(chǔ),凝練出標(biāo)準(zhǔn)化的ToB解決方案,為各行各業(yè)的企業(yè)客戶(hù)降本提效,將世界第一梯隊(duì)的大模型用到實(shí)處,真正為企業(yè)帶來(lái)業(yè)務(wù)增長(zhǎng)和新競(jìng)爭(zhēng)力。

Q:從國(guó)際權(quán)威盲測(cè)榜單 LMSYS 結(jié)果來(lái)看,Yi-Large已經(jīng)將中美頂級(jí)模型之間的時(shí)間差距縮短至六個(gè)月,而最新模型更是超越了GPT-4o,進(jìn)一步將這一時(shí)間差距縮短至五個(gè)月。對(duì)于中國(guó)的大模型初創(chuàng)公司而言,為了持續(xù)縮小與國(guó)際領(lǐng)先水平的時(shí)間差距,預(yù)訓(xùn)練模型需要具備哪些獨(dú)特的特性和優(yōu)勢(shì)?

李開(kāi)復(fù):縮短時(shí)間差非常困難,我不預(yù)測(cè)我們可以縮短這個(gè)時(shí)間差。因?yàn)楫吘谷思沂怯檬f(wàn)張GPU訓(xùn)練出來(lái),我們用的是兩千張GPU訓(xùn)練出來(lái),我們時(shí)間差能達(dá)到只是因?yàn)槲覀兡P、AI Infra等團(tuán)隊(duì)都熱心聰明,去使用和理解對(duì)方做出來(lái)的東西,再加上我們自己每家的研發(fā)有特色,比如數(shù)據(jù)處理、訓(xùn)推優(yōu)化等等,現(xiàn)在這一套方法論在零一萬(wàn)物已經(jīng)成熟了,我們有信心把自己的創(chuàng)新加上我們的一些特長(zhǎng),在關(guān)注OpenAI和其他公司發(fā)布的新技術(shù),盡快地去能夠了解這些技術(shù)的核心重要性,然后把它的能力在我們自己的產(chǎn)品里面發(fā)揮出來(lái),我覺(jué)得這套方法保持在六個(gè)月左右,就已經(jīng)是很好的結(jié)果了。

如果期待破局,可能需要一個(gè)前所未有的算法才有機(jī)會(huì)。我們千萬(wàn)不要認(rèn)為落后六個(gè)月是一個(gè)很羞恥的事情,或者一定是要追趕的事情。因?yàn)槲液芏嗝绹?guó)朋友都認(rèn)為中國(guó)會(huì)遠(yuǎn)遠(yuǎn)落后,也有美國(guó)朋友包括一些中國(guó)朋友按照這個(gè)打法,人家十萬(wàn)張GPU等,我們要被甩掉三年、五年甚至十年都有可能。

現(xiàn)在從零一萬(wàn)物證明了不會(huì)落后這么多,而且這次LMSYS的榜單上也有兩家其他中國(guó)公司表現(xiàn)也不錯(cuò),也不是只有我們一家在做。所以對(duì)于奮力圖強(qiáng)、勤奮努力、聰明多元化的團(tuán)隊(duì),在國(guó)內(nèi)擁有這樣團(tuán)隊(duì)的公司,要用類(lèi)似零一萬(wàn)物的打法,去貼近美國(guó)最頂尖的公司,不落后超過(guò)六個(gè)月,我覺(jué)得是可能,而且不只是我們一家可能,但難度是高的,希望再往下減非常困難,除非真的有一個(gè)發(fā)明和科技上的突破。

Q:零一萬(wàn)物在海外市場(chǎng)推出了面向消費(fèi)者(To C)的產(chǎn)品,同時(shí)在國(guó)內(nèi)也逐步推出了面向企業(yè)(To B)的產(chǎn)品。在這種背景下,如何看待To B和To C產(chǎn)品之間的界限?

李開(kāi)復(fù):對(duì),我覺(jué)得一個(gè)大模型公司同時(shí)做to B和to C也是很辛苦的,也是需要多元化的管理方式,因?yàn)閮蓚(gè)團(tuán)隊(duì)的基因不一樣,做事的方法和衡量KPI的方法都不太一樣,我自己在這兩個(gè)領(lǐng)域有經(jīng)驗(yàn),也在試著做,但是也絕對(duì)不能什么都做,所以to B選擇做國(guó)內(nèi)因?yàn)槲覀冋业搅艘恍┢凭值目臻g,比如用數(shù)字人來(lái)做零售,來(lái)做餐飲等等,這能做一個(gè)完整的解決方案,另外還有兩三個(gè)領(lǐng)域開(kāi)始在做,現(xiàn)在還不方便披露。

我們覺(jué)得這樣的to B工作只能在中國(guó)做,因?yàn)橐|達(dá)美國(guó)的用戶(hù)或國(guó)外的用戶(hù)不太可能,所以全世界的范疇來(lái)說(shuō),to B供應(yīng)商基本都是當(dāng)?shù)氐?/strong>,即便在中國(guó)要買(mǎi)SAP的產(chǎn)品也是SAP中國(guó)賣(mài)給你,所以跨國(guó)的設(shè)立分公司做to B絕對(duì)不是我們或其他的創(chuàng)業(yè)公司能做的,所以to B的國(guó)外就放棄了,做to B就做國(guó)內(nèi),做to B就做有利潤(rùn)的解決方案,而不只是賣(mài)模型,不只是做項(xiàng)目制,這是我們to B的做法。

to C我們主要布局海外,有好幾個(gè)理由。第一個(gè)理由,當(dāng)我們開(kāi)始做零一萬(wàn)物時(shí)國(guó)內(nèi)還沒(méi)有合適的中文模型,我們只有在國(guó)外先嘗試,嘗試了一段就有了心得,就迭代了一個(gè)、兩個(gè)、三個(gè)產(chǎn)品,這些產(chǎn)品現(xiàn)在表現(xiàn)有些很好,有些沒(méi)有那么好,我們也在不斷地調(diào)整中。

我們?cè)趪?guó)內(nèi)也在觀察什么時(shí)候適合在國(guó)內(nèi)做什么樣的產(chǎn)品,to C的產(chǎn)品在中國(guó)國(guó)內(nèi)走流量有一個(gè)很大的問(wèn)題,就是流量的成本越來(lái)越高,我們也看到了有些友商的單用戶(hù)成本從十幾塊人民幣加到三十多塊人民幣,近來(lái)還有相當(dāng)?shù)牧魇?/strong>,在這樣一個(gè)挑戰(zhàn)環(huán)境里我們會(huì)非常謹(jǐn)慎,先不推出中國(guó)本土新的to C的應(yīng)用,我們已有的產(chǎn)品還會(huì)繼續(xù)維護(hù),但更多的精力會(huì)在國(guó)外的土壤用更低廉的錢(qián)買(mǎi)到非常高質(zhì)量的用戶(hù),或者能直接把App賣(mài)出去,讓用戶(hù)來(lái)訂閱收費(fèi),這個(gè)訂閱的習(xí)慣在國(guó)外也是比較良好,主要是這幾個(gè)理由。

現(xiàn)在當(dāng)下最大的理由還是說(shuō)國(guó)外做to C的產(chǎn)品,我們變現(xiàn)能力和消耗用戶(hù)增長(zhǎng)的成本算賬可以算得過(guò)來(lái),以后再關(guān)注國(guó)內(nèi)有什么機(jī)會(huì)可以推出。

有關(guān)這兩者有沒(méi)有相似的地方?相似挺多。首先兩邊都需要非常高質(zhì)量、快速的模型,我們有。另外我們會(huì)需要用到各種預(yù)訓(xùn)練和后訓(xùn)練的技術(shù),這兩邊都會(huì)用上,一個(gè)to C的應(yīng)用,調(diào)一個(gè)數(shù)字人的應(yīng)用方法都需要類(lèi)似的技術(shù),我們有技術(shù)累積。當(dāng)我們最終做出產(chǎn)品,比如to B的產(chǎn)品里面需要的各種功能,還有to C需要的功能也有很多可以共用,比如AI閱讀、AI撰寫(xiě)、AI PPT、AI搜索是很多to B、to C應(yīng)用需要的模塊,今天看傳統(tǒng)的軟件底層還有很多是相似的,就是Windows里面提供平臺(tái)的API都是to B、to C共用,我們也在累積這些共用的地方

Q:零一的新模型居然拿出如此低的價(jià)格,是否有比較大的成本壓力?

李開(kāi)復(fù):零一萬(wàn)物在Yi-Lightning的定價(jià)上并沒(méi)有虧本。從成立的第一天起,零一萬(wàn)物就同時(shí)啟動(dòng)了模型訓(xùn)練、AI Infra、AI 應(yīng)用三大團(tuán)隊(duì)。當(dāng)三個(gè)團(tuán)隊(duì)都成熟了以后,再對(duì)接到一起。零一萬(wàn)物這一模式總結(jié)為;步ā⒛(yīng)一體兩大戰(zhàn)略——AI Infra能力助力模型訓(xùn)練和推理,以更低的訓(xùn)練成本訓(xùn)練出性能領(lǐng)先的模型,以更低的推理成本支撐應(yīng)用層的探索。出色的模型性能與低廉的推理成本不僅能支撐零一萬(wàn)物開(kāi)拓絕佳的ToB應(yīng)用場(chǎng)景,還能讓零一萬(wàn)物推出的大模型ToB解決方案更具性?xún)r(jià)比,進(jìn)而與企業(yè)合作伙伴一起探尋大模型時(shí)代的TC-PMF。

之前回應(yīng)行業(yè)價(jià)格戰(zhàn)時(shí),我的回答就是零一萬(wàn)物不參與價(jià)格戰(zhàn)。另外,我當(dāng)時(shí)也提到,不能只看模型價(jià)格,還要看模型性能是否足夠好。當(dāng)時(shí)有很多性能較差的模型價(jià)格降到非常低,甚至是免費(fèi),我相信當(dāng)時(shí)選擇接入這類(lèi)模型API的企業(yè)與個(gè)人,收獲都不達(dá)預(yù)期。要接入API,足夠好的模型性能很重要,不然產(chǎn)品無(wú)法達(dá)到PMF。

另外很重要的一點(diǎn)就是把高性能模型的價(jià)格降到白菜價(jià),0.99元人民幣/百萬(wàn) token 的價(jià)格很便宜,但如果一個(gè)應(yīng)用里每個(gè)用戶(hù)每天調(diào)用十幾次,累積下來(lái)每年的成本還是不容忽視的。

零一萬(wàn)物也在做App,我們知道做App需要控制成本,所以我們不會(huì)賠錢(qián)賣(mài)模型,但也不會(huì)賺很多錢(qián),而是在成本線(xiàn)上加一點(diǎn)點(diǎn)小小的利潤(rùn),就得到了今天0.99元/百萬(wàn)token的價(jià)格。歡迎大家試用,一定物超所值。挑選模型API最重要的一點(diǎn),就是模型性能一定要優(yōu)秀,在這個(gè)前提之下才能去挑最便宜的,實(shí)際算一算用戶(hù)調(diào)用量會(huì)是多少,賬算不算得過(guò)來(lái)。我相信,綜合Yi-Lightning的模型質(zhì)量和價(jià)格來(lái)看,Yi-Lightning很可能是很多開(kāi)發(fā)者最認(rèn)可、最高性?xún)r(jià)比的模型了。

Q:此次公布的 ToB 解決方案矩陣是完整的嗎?近期是否還會(huì)公布其他 ToB 解決方案?

李開(kāi)復(fù):除了我們已經(jīng)發(fā)布的AI 2.0數(shù)字人、API之外,零一萬(wàn)物目前還有 AI Infra 解決方案、私有化定制模型等其他 ToB 業(yè)務(wù),我們會(huì)在近期正式對(duì)外發(fā)布,敬請(qǐng)期待。

本文來(lái)源:騰訊科技

網(wǎng)友評(píng)論

聚超值•精選

推薦 手機(jī) 筆記本 影像 硬件 家居 商用 企業(yè) 出行 未來(lái)
  • 二維碼 回到頂部