大模型終究要淚奔,誰(shuí)才是Ai行業(yè)的“掘金者” ? | 【硬AI】
AI行業(yè)火了大半年,時(shí)至今日誰(shuí)才是產(chǎn)業(yè)鏈里的掘金人呢?
(資料圖片)
可以是給大模型訓練提供數據的供應商、可以是自由定價(jià)的C端產(chǎn)品,但唯獨不會(huì )是大模型提供方。
究其原因,如何選擇好的賽道,首先要有不錯的商業(yè)模式,其次是行業(yè)上下游的議價(jià)能力,最后看利潤。
無(wú)論是選擇好公司還是好賽道都離不開(kāi)以上三點(diǎn)。
接下來(lái)我們具體聊聊:
為什么大模型賽道不行了?AI行業(yè)涌現的機會(huì )在哪里?
絕大多數的大模型企業(yè)要淚奔
為什么這么說(shuō)?
因為,大模型企業(yè)很難滿(mǎn)足上述提到的重要三要素。
從年初,OpenAI帶著(zhù)ChatGPT震驚全世界,封閉大模型成為主流;谷歌、百度等海內外一眾互聯(lián)網(wǎng)龍頭都紛紛怕掉隊,哪怕是產(chǎn)品還不成熟,都著(zhù)急忙慌的出來(lái)路演,就像第一次面世的Bard讓谷歌跌掉了1000億市值。
后來(lái),Meta發(fā)布開(kāi)源大模型Llama,變成了開(kāi)源大模型的鼻祖,開(kāi)源大模型讓眾多企業(yè)、研發(fā)人員有了追趕GPT的機會(huì )(沒(méi)有開(kāi)源,那只會(huì )望塵莫及,畢竟通用大模型的訓練成本不是隨便一家企業(yè)能承受的);
也正是因為有了開(kāi)源大模型,才讓大模型市場(chǎng)發(fā)展的如火如荼,有了今日的“百模、千模大戰。
但是,隨之而來(lái)的是大模型企業(yè)所面臨的問(wèn)題。
首先,各家大模型與Open AI的差距還是很明顯,留給其他大模型廠(chǎng)家的市場(chǎng)空間就已經(jīng)很小。另外,市場(chǎng)上其余可選大模型非常多,比如眾多開(kāi)源衍生品,但產(chǎn)品同質(zhì)化嚴重,這也就會(huì )導致大模型在面對客戶(hù)時(shí)的話(huà)語(yǔ)權非常低,毫無(wú)議價(jià)權;
其次,大模型企業(yè)為了優(yōu)化輸出結果,還需要不斷的迭代模型,而這需要大量、專(zhuān)業(yè)的數據投喂進(jìn)行訓練,因此數據企業(yè)提供方也會(huì )成為制約大模型發(fā)展的重要角色。
最后,大模型的訓練成本很高不說(shuō),想要做出超強大模型還得拼算力,也就是看誰(shuí)能搶到更多英偉達A/H100芯片;
另外,在大模型定價(jià)方面只會(huì )越來(lái)越難,開(kāi)源已經(jīng)是常態(tài)了,連openAI最近也要開(kāi)源新的大模型了,如果GPT3.5開(kāi)源,那對于其他大模型廠(chǎng)商來(lái)說(shuō)可謂是毀滅性的打擊。
對于大部分的大模型方來(lái)說(shuō)都面臨著(zhù)一邊難收費,一邊要拼命花錢(qián)訓練模型,以后數據也會(huì )開(kāi)始收費(又多了花錢(qián)的渠道),怎么想大模型都不是一個(gè)看起來(lái)能輕易盈利的商業(yè)模式。
未來(lái)肯定很多企業(yè)會(huì )放棄這條擁擠、又不賺錢(qián)的賽道。除非是能追上GPT4的水平,真正做到讓用戶(hù)覺(jué)得好用,才會(huì )有絕對的競爭力。
數據運營(yíng)商的春天要來(lái)了
上文提到,扼住大模型發(fā)展的除了AI芯片,那就是訓練大模型必不可少的數據。
我們認為,數據運營(yíng)商將迎來(lái)發(fā)展的黃金期,不過(guò)還要適當考慮各國情況的差異性(這里不做展開(kāi))。
數據是新型生產(chǎn)要素,這句話(huà)在大模型這里得到非常好的體現。
值得關(guān)注的是,數據商將成為行業(yè)賣(mài)水人。
谷歌最近就因為非法搜集用戶(hù)數據用于訓練AI模型,被美國加利福尼亞州克拉克森律師事務(wù)所起訴,要求向用戶(hù)賠償數據使用費和告知數據用途。
數據價(jià)值已經(jīng)開(kāi)始顯現。
近日,海外Prolific公司不僅獲得3200萬(wàn)美元融資,還賺了1億+美元的數據提供費用;每小時(shí)價(jià)格在6—8美元或更高。
也就是說(shuō),Prolific這種為企業(yè)或個(gè)人提供的數據是可以用于商業(yè)化并且具有版權的。這一點(diǎn)對于大模型廠(chǎng)商來(lái)說(shuō)非常重要,能夠很好避免產(chǎn)生數據版權的糾紛。
Prolific已獲得了3000多家知名組織,其中包括谷歌、牛津大學(xué)、斯坦福大學(xué)、倫敦國王學(xué)院和歐盟委員會(huì )等。超過(guò)2萬(wàn)名科研人員在其平臺上獲取高質(zhì)量數據。
Prolific也表示,高質(zhì)量、真實(shí)訓練數據對于A(yíng)I大模型來(lái)說(shuō)能夠減少幻覺(jué)、非法輸出、增強RLHF能力。
我們認為,數據運營(yíng)商在大模型上的商業(yè)價(jià)值才開(kāi)始顯現。
C端應用是AI流量必爭之地
哪里有流量,哪里就有財富。
之前業(yè)內都在討論到底是封閉大模型還是開(kāi)源大模型的生態(tài)會(huì )更好,哪個(gè)模式的商業(yè)價(jià)值更勝一籌;
最后得到的結論是:開(kāi)源還是封閉其實(shí)不是最核心的問(wèn)題,關(guān)鍵在于如何形成好的數據飛輪效應。
最近“數據飛輪“這個(gè)詞在科技圈內非?;?,簡(jiǎn)單來(lái)說(shuō)是一種描述數據價(jià)值增長(cháng)的循環(huán)過(guò)程。
在互聯(lián)網(wǎng)時(shí)代我們看到數據量的激增,而在A(yíng)I時(shí)代數據爆發(fā)將遠超上一次。
如果從產(chǎn)品落地和價(jià)值變現的速度來(lái)看,那么C端應用定是巨頭必爭之地。
無(wú)論是微軟用Microsoft 365 Copilot開(kāi)啟辦公AI時(shí)代、Windows11即將內嵌人工智能助手顛覆每個(gè)人操作電腦的習慣;
還是一直在內卷的AI繪畫(huà)、和即將開(kāi)卷的AI視頻;
C端應用往往比B端更容易落地、也更容易變現,核心在于C端產(chǎn)品更標準化;
而B(niǎo)端的場(chǎng)景、訴求更多,很難統一,這也就導致了落地進(jìn)度更難,更別提還有很多隱私數據、know-how等專(zhuān)業(yè)內容要考慮。
這也就為什么在國內互聯(lián)網(wǎng)流量紅利期賺的盆滿(mǎn)缽滿(mǎn)的是阿里、騰訊、字節這樣的巨頭,因為他們掌握了C端流量,而工業(yè)互聯(lián)網(wǎng)企業(yè)都活在了“貧民窟”;
誰(shuí)掌握了用戶(hù)流量、產(chǎn)品定價(jià),現金收入便是有了保障,同時(shí)還能獲得廣告商的青睞;
另一方面,想要做C端應用的企業(yè)還有很多大模型可供選擇,就好比金山辦公已經(jīng)開(kāi)始這么做了,基于三種大模型之上來(lái)調度,根據任務(wù)選擇性能最優(yōu)的大模型。
總得來(lái)說(shuō),C端一定會(huì )成為AI行業(yè)最先變現的賽道。
本文作者:韓楓,來(lái)源:硬AI,原文標題:微軟、谷歌、Meta:AI巨頭「三國爭霸」| 【硬AI】;
未經(jīng)授權不得轉載。
風(fēng)險提示及免責條款 市場(chǎng)有風(fēng)險,投資需謹慎。本文不構成個(gè)人投資建議,也未考慮到個(gè)別用戶(hù)特殊的投資目標、財務(wù)狀況或需要。用戶(hù)應考慮本文中的任何意見(jiàn)、觀(guān)點(diǎn)或結論是否符合其特定狀況。據此投資,責任自負。關(guān)鍵詞: