作者 | 方文三
前言:降價(jià)帶來的壓力迫使生產(chǎn)者進(jìn)一步壓縮成本,提高效率,同時(shí)使產(chǎn)品能夠更廣泛地滲透市場。這一點(diǎn)在過去的網(wǎng)約車和電商價(jià)格戰(zhàn)中已得到多次驗(yàn)證。
同樣,在價(jià)格競爭的背景下,大型模型市場正在逐漸發(fā)生變化。市場對大型模型的關(guān)注點(diǎn)正從技術(shù)性能本身,轉(zhuǎn)向人工智能應(yīng)用的實(shí)際落地和商業(yè)變現(xiàn)。
大模型廠商價(jià)格戰(zhàn)停不下來
在2024年的歲末,阿里云正式宣布其通義千問視覺理解模型的價(jià)格全面下調(diào)超過80%,這標(biāo)志著通義千問在一年內(nèi)實(shí)施的第三次降價(jià)。
此次降價(jià)幅度高達(dá)81.3%,創(chuàng)下了全網(wǎng)最低價(jià)。
根據(jù)新的定價(jià),消費(fèi)者僅需支付1元人民幣,即可處理最多約600張分辨率為720P的圖片,或1700張分辨率為480P的圖片。
在阿里云宣布降價(jià)的十余天之前,字節(jié)跳動(dòng)推出的豆包視覺理解模型的價(jià)格已較業(yè)界平均水平低出85%;
其千tokens輸入價(jià)格僅為0.03元人民幣,這意味著1元人民幣可處理284張分辨率為720P的圖片。
行業(yè)競爭以價(jià)格戰(zhàn)的形式出現(xiàn)時(shí),通常意味著行業(yè)內(nèi)的企業(yè)已經(jīng)處于激烈的競爭狀態(tài)。
降價(jià)并非萬能之策,但在大型模型的競爭中,任何一方都難以承受失敗。
目前,大型模型主要向企業(yè)端(B端)收費(fèi),而向消費(fèi)者端(C端)收費(fèi)的情況較少,且消費(fèi)者的付費(fèi)意愿普遍不高,這決定了大部分消費(fèi)者對價(jià)格戰(zhàn)的感受并不顯著。
在消費(fèi)者端,許多大型模型應(yīng)用程序采用的是[對話體]界面,即用戶輸入一段文字,大型模型提供相應(yīng)的回復(fù),使用體驗(yàn)類似于使用微信、QQ等應(yīng)用程序與朋友聊天。
次回復(fù)背后都在調(diào)用大型模型,消費(fèi)者無需為聊天服務(wù)付費(fèi),但提供聊天服務(wù)的機(jī)構(gòu)卻需要為此承擔(dān)成本。
也就是說,API調(diào)用是一門虧損的生意,大型模型的成本越高,虧損就越大;大型模型降價(jià),虧損就會相應(yīng)減少。
大型模型的商業(yè)模式
①包含模型推理的基礎(chǔ)服務(wù),即根據(jù)輸入的信息內(nèi)容提供答案的過程。簡而言之,這是[實(shí)際使用]模型的環(huán)節(jié)。不同供應(yīng)商提供的模型標(biāo)準(zhǔn)各有差異。
②模型精調(diào)服務(wù),廠商可根據(jù)客戶需求,按照token使用量(訓(xùn)練文本乘以訓(xùn)練迭代次數(shù))進(jìn)行計(jì)費(fèi),訓(xùn)練完成后結(jié)算,實(shí)行按需付費(fèi)。
③服務(wù)為模型部署,這相當(dāng)于客戶獨(dú)享一部分計(jì)算資源,屬于大客戶范疇,其收費(fèi)模式是根據(jù)消耗的計(jì)算資源或模型推理的token數(shù)量按量計(jì)費(fèi)。
這三種收費(fèi)模式反映了大型模型開發(fā)由淺入深的演進(jìn)過程。
而各大科技公司激烈競爭的焦點(diǎn),實(shí)際上是第一種基礎(chǔ)服務(wù),即標(biāo)準(zhǔn)版模型的推理費(fèi)用。
在調(diào)用大型模型時(shí),通常會根據(jù)輸入和輸出的token數(shù)量實(shí)施雙向計(jì)費(fèi)。
當(dāng)前,科技企業(yè)逐漸認(rèn)識到,單純推出免費(fèi)應(yīng)用程序已不足以直接為公司創(chuàng)造收益,且難以有效增加消費(fèi)者用戶基數(shù),獲客成本顯著上升。
更為關(guān)鍵的是,直接接觸那些愿意為服務(wù)付費(fèi)的商業(yè)客戶,例如金融、政府、汽車等行業(yè)的企業(yè)。
然而,當(dāng)眾多企業(yè)紛紛涌入同一行業(yè)時(shí),往往會導(dǎo)致長期的價(jià)格競爭。
這是因?yàn)楦髌髽I(yè)都試圖建立一個(gè)示范客戶,以利于后續(xù)的市場擴(kuò)張。
將加速大模型應(yīng)用生態(tài)發(fā)展與智算云增長點(diǎn)
技術(shù)的普及將推動(dòng)應(yīng)用領(lǐng)域的創(chuàng)新成本降低。
隨著大模型推理成本的降低,基于大模型開發(fā)應(yīng)用的創(chuàng)新成本也將隨之降低,可能會迎來新應(yīng)用開發(fā)和新場景試錯(cuò)的高潮期。
數(shù)據(jù)顯示,百萬tokens大約相當(dāng)于70萬個(gè)英文單詞或50萬個(gè)漢字,按照當(dāng)前大模型API調(diào)用價(jià)格計(jì)算,1元可以購買超過100萬個(gè)漢字。
對于中小企業(yè)而言,部署并應(yīng)用針對本企業(yè)的大型模型應(yīng)用的成本降低,可能會激發(fā)企業(yè)開發(fā)應(yīng)用的意愿。
可以預(yù)見,隨著大模型應(yīng)用開發(fā)成本的不斷降低,將加速出現(xiàn)爆款超級應(yīng)用,推動(dòng)大模型應(yīng)用生態(tài)的加速繁榮。
從長期來看,這將進(jìn)一步催生智算云的新增長點(diǎn)。
據(jù)Gartner的研究顯示,隨著價(jià)格的持續(xù)下降以及云服務(wù)在敏捷性、創(chuàng)新速度和生態(tài)系統(tǒng)構(gòu)建方面的優(yōu)勢,中國企業(yè)的人工智能部署將逐漸從本地環(huán)境轉(zhuǎn)向云端。
Gartner預(yù)測,到2027年,中國所有AI推理工作負(fù)載中,基于云的負(fù)載比例將從先前的20%增長至80%。
Gartner高級研究總監(jiān)方琦指出:[多家中國生成式人工智能(GenAI)供應(yīng)商已將大語言模型應(yīng)用編程接口(API)的推理成本降低超過90%,這極大地促進(jìn)了企業(yè)對GenAI技術(shù)的采納。]
2025年國內(nèi)大型模型的競爭將持續(xù)激烈
從[百模大戰(zhàn)]演進(jìn)至當(dāng)前的[應(yīng)用之戰(zhàn)],市場愈發(fā)期待在模型中孕育出能夠?qū)嶋H應(yīng)用的成果,以此為大型模型的生產(chǎn)商創(chuàng)造收益,并為各行各業(yè)提升工作效率。
相較于OpenAI的同規(guī)格模型,國內(nèi)模型的價(jià)格普遍較低,僅為后者的20%-50%。盡管大模型的價(jià)格競爭已導(dǎo)致負(fù)毛利,但各大云服務(wù)提供商仍持續(xù)下調(diào)價(jià)格。
據(jù)國際市場調(diào)研機(jī)構(gòu)IDC預(yù)測,2022年至2027年,中國通用算力的年復(fù)合增長率為16.6%,而智能算力的年復(fù)合增長率將達(dá)到33.9%。
在智能算力領(lǐng)域內(nèi)部,推理算力的占比預(yù)計(jì)將在2027年上升至72.6%,而訓(xùn)練算力的占比則會降至27.4%。
國企業(yè)缺乏與OpenAI相似的算力資源和融資環(huán)境,算力成為中國模型制造商的關(guān)鍵短板。
過去一年多,中國云服務(wù)提供商為采購英偉達(dá)的AI芯片支付了超過1.5倍的采購成本,這導(dǎo)致了模型算力成本的居高不下。
這不僅影響了大模型的性能上限,也阻礙了大模型的產(chǎn)業(yè)化進(jìn)程。
在這種背景下,不得不放棄收費(fèi)模式,通過降價(jià)甚至免費(fèi)的方式,通過用戶[免費(fèi)試用]來探索商業(yè)落地的場景。
據(jù)了解,幾家大模型制造商都提供了不同程度的注冊免費(fèi)額度,例如智譜AI宣布為新注冊的開放平臺用戶贈送2500萬tokens。
據(jù)IDC預(yù)測,到2026年,中國AI大型模型市場的規(guī)模有望達(dá)到211億美元,屆時(shí)人工智能將進(jìn)入大規(guī)模應(yīng)用的關(guān)鍵時(shí)期。
激烈的價(jià)格戰(zhàn)可能會導(dǎo)致一些企業(yè)主動(dòng)或被動(dòng)地退出市場,待市場穩(wěn)定后,價(jià)格才會回歸正常水平。
大模型的市場推廣戰(zhàn),與移動(dòng)互聯(lián)網(wǎng)初期應(yīng)用爭奪用戶的燒錢推廣策略極為相似,各應(yīng)用通過大量資金投入甚至直接補(bǔ)貼來吸引用戶。
然而,動(dòng)輒上億的廣告成本未必能確保用戶長期的消費(fèi)意愿,用戶留存仍是大模型廠商面臨的不確定因素。
在長期的價(jià)格戰(zhàn)中技術(shù)成本成為競爭的關(guān)鍵
簡而言之,在提供相同的解決方案和報(bào)價(jià)的情況下,技術(shù)成本較低的企業(yè)將承受較少的虧損,并能更長久地生存。
目前,國內(nèi)主要的大模型制造商在這些方面基本處于同一水平,并且他們的迭代速度和相互追趕的節(jié)奏也相差無幾。
價(jià)格是影響大模型企業(yè)的一個(gè)因素,但更為關(guān)鍵的是技術(shù)能力。
國內(nèi)的阿里、昆侖萬維等企業(yè)也推出了類似o1模型的產(chǎn)品,盡管存在差距,但這也表明他們認(rèn)同這一發(fā)展趨勢。
根據(jù)GPT系列的發(fā)展節(jié)奏,預(yù)計(jì)所有廠商將在2025年上半年全面跟進(jìn)o系列的步伐,此后,當(dāng)前的技術(shù)將逐漸退出市場。
因此,對于大模型制造商而言,與其坐等被市場淘汰,不如在淘汰到來之前,讓技術(shù)迭代發(fā)揮更大的作用。
結(jié)尾:
在短期內(nèi),大型模型的性能似乎遭遇了發(fā)展瓶頸,各競爭者之間難以顯著拉開差距,亦難以推出決定性的突破技術(shù)。
然而,從另一角度來看,大型模型的價(jià)格下降對用戶而言是一個(gè)積極的信號,因?yàn)檫@將使他們能夠以更低的成本接觸并利用先進(jìn)的AI技術(shù),從而促進(jìn)市場上優(yōu)秀AI應(yīng)用的涌現(xiàn)。
盡管如此,整個(gè)行業(yè)距離形成成熟的商業(yè)生態(tài)系統(tǒng)仍有相當(dāng)長的路要走。
部分資料參考:
FT中文網(wǎng):《大模型的2025:卷價(jià)格,更要卷應(yīng)用》,APPSO:《中國大模型價(jià)格戰(zhàn):大廠殺瘋了,李開復(fù)王小川不跟風(fēng),最先被卷死的是誰》,科創(chuàng)板日報(bào):《大模型降價(jià)潮再起》,財(cái)經(jīng)雜志商業(yè)評論:《大模型價(jià)格戰(zhàn),打到了負(fù)毛利》,數(shù)字經(jīng)濟(jì)雜志:《人工智能大模型[價(jià)格戰(zhàn)]的原因及影響分析》,中外管理傳媒:《為何OpenAI在漲價(jià),國產(chǎn)大模型卻陷入價(jià)格戰(zhàn)?》,驚蟄研究所:《大模型2024:先把價(jià)格打下去》,吳曉波頻道:《AI大模型價(jià)格戰(zhàn)開打,一年決勝負(fù)?》,豹變:《大模型[自殺式降價(jià)],大廠為搶生意開打價(jià)格戰(zhàn)》,科技新知:《[卷王]豆包上桌,壓力給到了誰?》