无码人妻精品一区二|京东快递查询快递单号|亚洲男人AV天堂午夜在|成人毛片18女人毛片免费看网站|人善交ZZZZXXXXX另类

字節(jié)跳動(dòng)掀起大模型價(jià)格戰(zhàn)

2024-5-16 19:01| 發(fā)布者: 仟茂傳媒| 查看: 1520| 評(píng)論: 0

摘要: 在AI上“遲鈍”了的字節(jié),憑借價(jià)格“逃逸了一波平庸”。主力模型0.0008元/千Tokens,較行業(yè)價(jià)格便宜99.3%的水平,讓外界直呼字節(jié)跳動(dòng)開啟了大模型的“價(jià)格戰(zhàn)”。5月15日,字節(jié)跳動(dòng)豆包大模型在火山引擎原動(dòng)力大會(huì)上 ...

在AI上“遲鈍”了的字節(jié),憑借價(jià)格“逃逸了一波平庸”。主力模型0.0008元/千Tokens,較行業(yè)價(jià)格便宜99.3%的水平,讓外界直呼字節(jié)跳動(dòng)開啟了大模型的“價(jià)格戰(zhàn)”。對(duì)行業(yè)來說,門檻的下降意味著生態(tài)繁榮進(jìn)程的再度提速,而對(duì)字節(jié)跳動(dòng)來說,這場“遲到”的發(fā)布會(huì),或許也意味著龐大的字節(jié),正在理順自己做AI的邏輯。

“價(jià)格力”

AI,也開始講“價(jià)格力”了。5月15日,字節(jié)跳動(dòng)豆包大模型在火山引擎原動(dòng)力大會(huì)上正式發(fā)布,目前主要包括通用模型pro、通用模型lite、語音識(shí)別模型、語音合成模型、文生圖模型等九款模型。

豆包大模型原名“云雀”,是國內(nèi)首批通過算法備案的大模型之一。但比起首次集體亮相的豆包大模型家族,價(jià)格才是這場發(fā)布會(huì)最大的意外和驚喜。

“豆包通用模型Pro 32k模型,正式定價(jià)是0.8厘/千Tokens,比行業(yè)價(jià)格降低99.3%”。發(fā)布會(huì)上,火山引擎總裁譚待公布這一數(shù)字的話音一落,現(xiàn)場就響起了一陣驚呼和掌聲。以至于讓譚待重復(fù),“對(duì),沒有聽錯(cuò),是降低99.3%”。

相比起來,市面上同規(guī)格模型的定價(jià)一般為0.12元/千Tokens,是豆包模型價(jià)格的150倍。火山引擎公布的價(jià)格計(jì)算顯示,一元錢能買到豆包主力模型的125萬Tokens,大約是200萬個(gè)漢字,相當(dāng)于三本《三國演義》。

什么支撐了豆包大模型的定價(jià),這可能是定價(jià)消息一出,最先跳出來的問題。在發(fā)布會(huì)后的群采中,譚待解釋稱,團(tuán)隊(duì)在技術(shù)上有非常多優(yōu)化手段,包括通過模型結(jié)構(gòu)的優(yōu)化調(diào)整,把成本做低、效果做好,通過分布式推理、混合調(diào)度大幅度降低部署成本等。

調(diào)用量給了豆包低價(jià)的底氣,而低價(jià)則是為了撬動(dòng)更大的市場。據(jù)悉,經(jīng)過一年的迭代和市場驗(yàn)證,豆包大模型正成為國內(nèi)使用量最大、應(yīng)用場景最豐富的大模型之一,目前日均處理1200億Tokens文本,生成3000萬張圖片。譚待認(rèn)為,降低成本是推動(dòng)大模型快進(jìn)到“價(jià)值創(chuàng)造階段”的一個(gè)關(guān)鍵因素。

“豆包的低價(jià)使得更多企業(yè)和個(gè)人能夠負(fù)擔(dān)得起大模型的使用費(fèi)用,從而降低了大模型技術(shù)的使用門檻,這將有助于大模型在更多行業(yè)和場景中的落地應(yīng)用。”北京市社會(huì)科學(xué)院副研究員王鵬對(duì)北京商報(bào)記者進(jìn)一步分析稱,低價(jià)策略有助于吸引更多的潛在客戶,擴(kuò)大市場份額。隨著用戶基數(shù)的增加,大模型的商業(yè)化前景也將更加廣闊。

輸不起的競賽

在時(shí)間節(jié)點(diǎn)上,AI的“價(jià)格力”故事也有巧合。兩天前,OpenAI用GPT-4o炸場,在API使用方面,相比GPT-4-turbo,GPT-4o價(jià)格降低一半,速度提升兩倍。

同一天,智譜大模型開放平臺(tái)上線了新的價(jià)格體系。其中入門級(jí)產(chǎn)品GLM-3 Turbo模型調(diào)用價(jià)格下調(diào)80%,從5元/百萬tokens降至1元/百萬tokens。

“從全球范圍看,大模型的推理成本,特別是非頂尖大模型推理成本的下降,比之前預(yù)估的進(jìn)度要快得多”。在接受北京商報(bào)記者采訪時(shí),互聯(lián)網(wǎng)投資人莊明浩如此說道。

而從國內(nèi)情況來看,低價(jià)可能也是一個(gè)必然之舉。莊明浩稱,相比起國外屈指可數(shù)的幾家大模型企業(yè),國內(nèi)大模型的競爭環(huán)境更為復(fù)雜,頭部企業(yè)、明星創(chuàng)業(yè)公司林立。但與之相對(duì)的是,應(yīng)用層的爆發(fā)卻慢于預(yù)期。因此在技術(shù)能力已經(jīng)進(jìn)入相對(duì)瓶頸的階段時(shí),盡可能地拓展應(yīng)用生態(tài),也是商業(yè)慣例。

而在頭部大模型企業(yè)中,大洋彼岸的戰(zhàn)況同樣激烈。北京時(shí)間5月15日凌晨,谷歌正式反擊OpenAI,不僅帶來了輕量化的模型Gemini 1.5 Flash、AI通用智能體Project Astra等重量級(jí)發(fā)布,還推出了OpenAI“跳票”了的AI搜索,捍衛(wèi)了自己在搜索市場上的地位。

對(duì)于如今字節(jié)跳動(dòng)是否會(huì)引發(fā)降價(jià)連鎖反應(yīng)的問題,王鵬認(rèn)為,當(dāng)一家企業(yè)采取低價(jià)策略時(shí),其他競爭對(duì)手為了保持或擴(kuò)大市場份額,往往也會(huì)采取相應(yīng)的降價(jià)措施。因此,豆包的低價(jià)策略很可能觸發(fā)大模型行業(yè)的價(jià)格戰(zhàn)。

有人甚至戲稱,可能要不了多久,企業(yè)調(diào)用大模型將不再需要成本,甚至企業(yè)調(diào)用大模型,相應(yīng)的大模型企業(yè)應(yīng)該提供補(bǔ)貼。這種玩笑反映了兩個(gè)層面的焦慮,一個(gè)在于應(yīng)用生態(tài),另一個(gè)在于市場競爭。

譚待也提到,對(duì)企業(yè)來說,在AI轉(zhuǎn)型上充滿太多不確定性,必須要讓試錯(cuò)成本盡量低。

“大模型發(fā)展至今,基礎(chǔ)技術(shù)到達(dá)瓶頸,人們迫切想要知道大模型能夠做什么,是否真的能實(shí)現(xiàn)飛輪效應(yīng),這些都需要時(shí)間,也需要錢。在這場沒人輸?shù)闷鸬母傎愔?,是否?huì)走向一種極端的價(jià)格戰(zhàn),誰也說不清”,莊明浩說道。

而對(duì)于燒錢的大模型來說,低價(jià)是否會(huì)壓縮盈利空間,也成為核心議題之一。對(duì)此,王鵬認(rèn)為,降價(jià)無疑會(huì)在短期內(nèi)對(duì)企業(yè)的盈利空間造成一定壓力。然而,這種壓力可以通過擴(kuò)大市場份額和提高使用率來緩解。

從長期看,王鵬認(rèn)為,隨著用戶數(shù)量的增加和使用頻率的提高,企業(yè)可以實(shí)現(xiàn)規(guī)模經(jīng)濟(jì),降低單位成本,從而在一定程度上抵消降價(jià)帶來的影響。此外,企業(yè)還可以通過提供增值服務(wù)、定制化服務(wù)等方式來增加收入來源,以應(yīng)對(duì)降價(jià)帶來的盈利壓力。

“我們不是以虧損為代價(jià)做這件事的,虧損是接受不了的”。群采中,譚待也提到,定價(jià)的基礎(chǔ)是對(duì)技術(shù)的信心。

遲到的發(fā)布會(huì)

2024年初的年度全員會(huì)上,字節(jié)跳動(dòng)CEO梁汝波給字節(jié)跳動(dòng)2024年定下的關(guān)鍵詞是“始終創(chuàng)業(yè),逃逸平庸的重力”。那場演講中,梁汝波多次提及“危機(jī)感”,比如組織平庸化的危機(jī)感、遲鈍的危機(jī)感。

AI也是危機(jī)感的來源之一。梁汝波說,公司層面的半年度技術(shù)回顧,直到2023年才開始討論GPT,而業(yè)內(nèi)做得比較好的大模型創(chuàng)業(yè)公司都是在2018―2021年創(chuàng)立的。

這樣的評(píng)價(jià)其實(shí)與外界對(duì)字節(jié)跳動(dòng)AI線條過于低調(diào)甚至“慢了”的印象不謀而合――此前包括豆包、扣子等產(chǎn)品發(fā)布的消息,大多是以“網(wǎng)傳”的形式而被外界接收,火山引擎原動(dòng)力大會(huì)可能是字節(jié)第一場真正意義上聚焦AI的發(fā)布會(huì)。

而慢了的字節(jié)跳動(dòng),也需要找回自己的節(jié)奏,無論是產(chǎn)品的發(fā)布,還是“舞臺(tái)”上的聚光。

“從傳播角度看,字節(jié)跳動(dòng)過去的AI動(dòng)作其實(shí)非常低調(diào),雖然豆包和扣子的數(shù)據(jù)不錯(cuò),但可能只有最關(guān)心這個(gè)行業(yè)的人才會(huì)知道,聲量上遠(yuǎn)不如智譜、MiniMax等企業(yè)。從這個(gè)意義上看,字節(jié)跳動(dòng)需要這樣一場發(fā)布會(huì),讓事情回到應(yīng)有的狀態(tài)里”。莊明浩說。

事實(shí)上,在長達(dá)一個(gè)小時(shí)的群采期間,豆包準(zhǔn)備的時(shí)長與現(xiàn)在才發(fā)布的時(shí)間點(diǎn)也被多次提及。譚待給出的回應(yīng)是,“我們的風(fēng)格就是不準(zhǔn)備好不要說出來”。

在莊明浩看來,字節(jié)跳動(dòng)的“慢”和“低調(diào)”,可能都要?dú)w結(jié)于組織架構(gòu)的龐大,“大模型一路發(fā)展下來,對(duì)這些體量超級(jí)大、業(yè)務(wù)超級(jí)復(fù)雜的公司而言,梳理好自身的AI戰(zhàn)略本來就是一件非常困難的事”。

莊明浩舉例稱,字節(jié)跳動(dòng)有各種各樣的產(chǎn)品,也很擅長開發(fā),造成如今的情況,更大可能是內(nèi)部沒有理清楚,到底是以火山引擎還是字節(jié)跳動(dòng)的名義、是以豆包還是扣子的名義,是以ToB還是ToC的名義講,這些可能都在字節(jié)跳動(dòng)內(nèi)部經(jīng)歷了一番博弈,劃分清楚之后,才有了這樣一場發(fā)布會(huì)。

巧合的是,群采期間,當(dāng)被問及字節(jié)跳動(dòng)在AI和大模型業(yè)務(wù)上的整體戰(zhàn)略思考時(shí),現(xiàn)場也有解釋提到,譚待主要負(fù)責(zé)火山引擎的部分,“可以聊聊火山引擎的戰(zhàn)略,字節(jié)跳動(dòng)的戰(zhàn)略可以回頭再聊”。

北京商報(bào)記者 楊月涵

(責(zé)任編輯:王治強(qiáng) HF013)