微軟不想被OpenAI架空
扎克伯格同學(xué)最近心情很不錯。
【資料圖】
與馬斯克在線(xiàn)激情互噴垃圾話(huà)后,對標“元宇宙版推特”的Threads僅用了不到五天的時(shí)間完成了1個(gè)億用戶(hù)的積累,成為了全球用戶(hù)總數破億速度最快的新社交平臺。Threads,成為小扎打在馬斯克臉上的一擊力拳。
但商場(chǎng)的拳臺上沒(méi)有裁判叫停,扎克伯格說(shuō)Threads的用戶(hù)規模目標是10億。而只有達到10億目標以后,Meta才會(huì )認真考慮Threads賺錢(qián)的問(wèn)題。這一數字相當于推特目前規模的兩倍。
扎克是認真的。無(wú)論是反感馬斯克版推特的憤怒用戶(hù),還是Meta帝國多年沉淀下的龐大商業(yè)機構關(guān)系網(wǎng),都在極短的時(shí)間內涌入了Threads平臺。而在無(wú)數游牧遷徙的用戶(hù)中,夾雜著(zhù)一個(gè)硅谷最有權勢的光頭——微軟首席執行官薩蒂亞·納德拉(Satya Nadella)。
納德拉過(guò)去是尊貴的推特藍V,擁有307萬(wàn)的用戶(hù),每天像AI一樣毫無(wú)感情地轉推各種微軟的新聞公關(guān)稿。不過(guò)這次他專(zhuān)門(mén)注冊了一個(gè)Threads賬號,熱情洋溢地宣布了微軟將與Meta的“大模型婚姻”:
微軟云Azure將幫Meta訓練和推廣Llama大模型,而Llama也將上線(xiàn)Azure庫和適配Windows系統。
而如雙方官宣文件所言,Azure從設備、硬件和軟件(facility, hardware and software)層面進(jìn)行了針對性的設計,從而支持世界領(lǐng)先的AI訓練。而在本次合作后,Llama的開(kāi)發(fā)者則可以利用Azure AI的工具進(jìn)行訓練、微調、推理和安全方面的功能開(kāi)發(fā)。
巨頭之間的云合作屢見(jiàn)不鮮。但全世界都知道,Azure可是OpenAI的御用云平臺。
在2019年微軟掏出10億美元投資OpenAI后,Azure就一直是OpenAI的獨家云服務(wù)商。而Azure為了更好地為大模型提供算力和對外服務(wù),重新進(jìn)行了部分架構設計。甚至在一些觀(guān)察者眼中,當年微軟拍板投資OpenAI的核心原因,其實(shí)就是Azure的發(fā)展——
畢竟彼時(shí)Transformer還沒(méi)有完全驗證,但微軟已經(jīng)多年下注AI并開(kāi)始將云業(yè)務(wù)的未來(lái)愿景視作是“為AI服務(wù)的超級計算設施”。無(wú)論是算力支持,還是OpenAI開(kāi)放全球的chatbot測試,Azure都功不可沒(méi)。
Altman本人甚至還曾經(jīng)專(zhuān)門(mén)發(fā)推對Azure團隊的給力支持表示感謝,高度評價(jià)微軟是“世界上最好的AI基礎設施”。
如今Sam前腳剛燒了兩炷香,納德拉轉手就把這個(gè)“世界上最好的AI基礎設施”租給了扎克伯格。
不知道倆人是不是提前商量好的。又或許對納德拉來(lái)說(shuō),這大概都是計劃的一部分??傊瞬癖憩F得很高興。
在扎克伯格的Instagram賬號里,他貼出了一張與納德拉的親密合影以“感謝納德拉”,扎克伯格表示:
“(Meta)將Llama2開(kāi)源給了微軟,而(這次開(kāi)源)將成為下一代大模型建設工作的基礎?!?/p>
微軟與Meta的確是相互需要的。
Meta正在走向大模型的“深水區”,在70B參數的Llama2已經(jīng)達到了GPT3.0的水平,幾乎已經(jīng)成為了目前口碑最好的大模型底座。對于閉源大模型陣營(yíng)來(lái)說(shuō),Llama2成功帶來(lái)的壓力一點(diǎn)不亞于Threads對于Twitter的震懾。
閉源公司花幾千萬(wàn)搞不出來(lái)的東西,開(kāi)源社區可以直接用,相當于將未來(lái)全球開(kāi)源大模型社區的起跑線(xiàn)提升到了3.0的水平。
最近登頂HuggingFace開(kāi)源大模型榜單的Stability的Freewilly大模型,被認為接近3.5的水平,正是基于Llama2.0調教優(yōu)化后的產(chǎn)品。
對于Meta來(lái)說(shuō),參數規模的提升帶來(lái)計算量的攀升、模型的逐步成熟也讓看到更好的商用潛質(zhì)。但如果要戰勝這些困難、落實(shí)這些潛力,扎克伯格需要一個(gè)更高效的合作伙伴。而那些Azure已經(jīng)有的、但Meta沒(méi)有的東西,對于Llama來(lái)說(shuō)就顯得更重要了,比如Azure的算力經(jīng)驗、Azure的AI工具箱、以及Azure的云本身……
Meta是為數不多沒(méi)有公有云服務(wù)的互聯(lián)網(wǎng)巨頭。
在過(guò)去,Meta與亞馬遜都互為對方的超級大客戶(hù),包括Meta的一些AI研發(fā)算力,也都是采購的AWS。而微軟這次撬墻角的方案,除了開(kāi)放Windows場(chǎng)景以外,還開(kāi)放了Azure的企業(yè)渠道能力,將Llama2加入到自己的產(chǎn)品名錄中。
Azure雖然在整體市場(chǎng)份額中依然落后AWS,但是在SaaS銷(xiāo)售領(lǐng)域卻顯著(zhù)領(lǐng)先于同類(lèi)競爭對手。而隨著(zhù)云與SaaS的融合,微軟在渠道層面有顯著(zhù)的差異化優(yōu)勢。通過(guò)Azure,Meta和它的生態(tài)追隨者們可以直接通過(guò)云端來(lái)銷(xiāo)售和使用Llama2的產(chǎn)品。
對于微軟來(lái)說(shuō),大模型的挑戰則更加多元的。
微軟過(guò)去在大模型應用層面幾乎是all in OpenAI的產(chǎn)品。無(wú)論是最早接入的Bing,還是基于Windows生態(tài)的Copilot\面向開(kāi)發(fā)者的工具生態(tài)AI Studio、甚至是新的AI云服務(wù)品牌OpenAI Azure,背后都是OpenAI的影子。
OpenAI是全球最好的大模型公司,Windows依然是全球最重要的生產(chǎn)力軟件生態(tài)。但在大模型全球軍備競賽中,這兩者的結合并不意味著(zhù)絕對的勝券在握。
與Meta和微軟結合幾乎同時(shí)“官宣”的,則是蘋(píng)果的大模型計劃。
據海外媒體報道,蘋(píng)果已經(jīng)完成了名為“Ajax”的大預言模型基礎框架,將開(kāi)發(fā)類(lèi)似ChatGPT的對話(huà)式AI。而消費級產(chǎn)品的推出時(shí)間則計劃在明年發(fā)布。
蘋(píng)果的入場(chǎng)被認為是硅谷大模型競賽中的重要變量。
相比于公有云之類(lèi)的互聯(lián)網(wǎng)風(fēng)口,AI是被蘋(píng)果管理層高度認可的科技方向,近期管理層口風(fēng)也有朝著(zhù)AI加碼的趨勢。
除了長(cháng)期關(guān)注AI科技外,蘋(píng)果是全球最有錢(qián)、最有場(chǎng)景的公司。蘋(píng)果每年凈利潤接近1000億美元、經(jīng)營(yíng)凈現金流超過(guò)1200億美元,相當于微軟與Meta的總和。蘋(píng)果生態(tài)已經(jīng)超過(guò)微軟成為全球最大的封閉操作系統,活躍設備數量超過(guò)20億,而微軟只有15億。
而相比于賬面實(shí)力外,蘋(píng)果更具想象力的是它的半導體能力。它或許是全球參與大模型競賽的科技企業(yè)中,為數不多將來(lái)可以不用外采GPU與CPU的廠(chǎng)商。不僅如此,蘋(píng)果的芯片效率似乎更有想象力。
在2023年WWDC上,蘋(píng)果推出的M2 Ultra芯片。相比于普通廠(chǎng)商CPU、GPU分離的部署方式,M2 Ultra統一內存架構以及隨之帶來(lái)的超高內存帶寬,甚至可以讓開(kāi)發(fā)者在一張卡上就能跑大模型。
盡管類(lèi)似的消費級芯片還無(wú)法和英偉達的專(zhuān)業(yè)芯片相媲美,但類(lèi)似小秀肌肉,也讓外界對蘋(píng)果未來(lái)的GPU算力延展能力產(chǎn)生了興趣。
以OpenAI為例,外界預估其大概同時(shí)動(dòng)用了兩萬(wàn)張顯卡進(jìn)行計算。但王小川近期對媒體表示,OpenAI正在測試1000萬(wàn)張顯卡同時(shí)計算的模型,相當于英偉達目前10年的產(chǎn)能,“完全是登月計劃(級別)”。
除了蘋(píng)果以外,微軟、谷歌、Meta、亞馬遜等巨頭都有自研AI芯片的計劃,但已經(jīng)有頂尖半導體開(kāi)發(fā)能力的蘋(píng)果依然是最有資格“大力出奇跡”的人。
Apple將兩枚 M2 Max 的芯片連接在一起打造出M2 Ultra
谷歌兇猛、蘋(píng)果虎視眈眈,微軟和Meta選擇結盟。
對于納德拉來(lái)說(shuō),與Meta隊形站位可以讓微軟在大模型的生態(tài)戰爭中更加穩固。
首先,微軟依然需要開(kāi)源,開(kāi)源在未來(lái)的大模型競爭中將持續扮演重要的角色。
開(kāi)源天然具有人才參與眾多、迭代速度快、垂類(lèi)覆蓋效率更高的生態(tài)能力。雖然OpenAI拿下頭籌,但開(kāi)源社區的進(jìn)步速度依然很可觀(guān)。比如Llama只用了大半年的時(shí)間、使用參數70B,已經(jīng)趕上了175B、耗時(shí)2年的GPT3。
尤其是如果未來(lái)開(kāi)源路線(xiàn)成為了行業(yè)解決方案的主流,Llama與Azure深度結合,或許真的可以幫助微軟云業(yè)務(wù)完成對AWS的彎道超車(chē)(2022年底Azure市占率23%、AWS為32%)。畢竟相比于Windows和Office,Azure才是微軟最賺錢(qián)、最有潛力的業(yè)務(wù)。
其次,開(kāi)源大模型的不斷發(fā)展,必然讓愿意砸錢(qián)做封閉系統的廠(chǎng)家也自然會(huì )越來(lái)越少。
比如Bard在Llama2之后就受到了不小的壓力。除了許多好事者在晚上討論bard未來(lái)長(cháng)期發(fā)展的壓力外,有媒體報道稱(chēng)谷歌內部人士也曾撰文稱(chēng)bard在對抗開(kāi)源社區時(shí)優(yōu)點(diǎn)吃力,后者進(jìn)步神速且成本更少、場(chǎng)景更豐富。
在大模型超級投入的產(chǎn)業(yè)結構沒(méi)有變化的情況下,封閉式大模型依然會(huì )有其存在的合理性,但可能將僅僅限于極少數領(lǐng)先者,而其中大概率會(huì )有OpenAI。
如果OpenAI有護城河,那它的名字可能叫Llama2。
圖源:valasys
當然,OpenAI其實(shí)也并不是微軟的“親兒子”。
在100億美元投資后,微軟雖然擁有75%的分紅權,但實(shí)際上也只占有OpenAI 49%的股權。換言之,微軟雖然手握大量的OpenAI資源,但并不完全擁有OpenAI絕對的控制權。
但與llama合作像是一個(gè)標志,手握OpenAI的微軟其實(shí)正在成為游戲規則的制定者:
它既有最具潛力的AI基礎設施Azure,也有最前沿的商業(yè)化變現接口Windows copilot。而當最核心的基礎設施和渠道能力在微軟手上時(shí),OpenAI也只是微軟的“超級程序員”。
當Meta等平臺成熟后,微軟可以再引入更多的“程序員”,甚至開(kāi)放更多的系統級場(chǎng)景給開(kāi)源生態(tài)、從而讓W(xué)indows系統的生產(chǎn)力進(jìn)一步提升。
實(shí)際上,OpenAI原本就只是納德拉重注AI和語(yǔ)言大模型的一個(gè)選項。
在ChatGPT之前,微軟甚至和英偉達合作開(kāi)發(fā)過(guò)5300億參數的大語(yǔ)言模型威震天-圖靈Megatron-Turing,是當年最大的基于transformer的模型,參數比GPT3多了好幾倍,講究的是絕對的大力出奇跡。
可最后威震天還是輸給了奧特曼,于是威震天才選擇了買(mǎi)下奧特曼。
但微軟內部其實(shí)一直沒(méi)有放棄大模型的相關(guān)技術(shù)路線(xiàn)開(kāi)發(fā)。
例如6月時(shí),微軟就發(fā)布了13億參數的“小型”大語(yǔ)言模型 phi-1。有OpenAI作為核心資產(chǎn),微軟不走“大力奇跡”模式,而是改用號稱(chēng)“教科書(shū)等級”的高品質(zhì)資料集訓練模型,讓實(shí)際效果勝于千億參數的 GPT 3.5。7月時(shí),微軟還提出了新的大模型架構RetNet,稱(chēng)其可以在更大數據維度基礎上,比transformer更優(yōu)。
圖源:arxiv.org
大模型的戰事還遠沒(méi)到中場(chǎng),威震天與奧特曼們的游戲或許才剛剛開(kāi)始。
本文作者:郭海惟,來(lái)源:硅星人,原文標題:《微軟不想被OpenAI架空》
風(fēng)險提示及免責條款 市場(chǎng)有風(fēng)險,投資需謹慎。本文不構成個(gè)人投資建議,也未考慮到個(gè)別用戶(hù)特殊的投資目標、財務(wù)狀況或需要。用戶(hù)應考慮本文中的任何意見(jiàn)、觀(guān)點(diǎn)或結論是否符合其特定狀況。據此投資,責任自負。關(guān)鍵詞: