啟明創(chuàng )投:最遲2024中國GPT4將誕生,長(cháng)文本是大語(yǔ)言模型關(guān)鍵|全球播報
7月7日周五,世界人工智能大會(huì )召開(kāi)的第二日,啟明創(chuàng )投合伙人周志峰作關(guān)于A(yíng)I大模型以及整個(gè)產(chǎn)業(yè)發(fā)展趨勢的分享。
(資料圖)
啟明創(chuàng )投是國內最早關(guān)注且最活躍在A(yíng)I該領(lǐng)域的創(chuàng )投機構之一,投資企業(yè)遍布整個(gè)AI生態(tài)鏈條,上游、中游、下游,其實(shí)都有設計,比如說(shuō)像芯片、基礎軟件,還有像大模型以及下游的垂直的應用等等。
大模型第一性原理是壓縮數字化的知識、信息和數據
周志峰強調,大規模的算力,大規模的數據對AI未來(lái)發(fā)展非常重要。
大規模訓練的第一性原理是用大規模去壓縮人類(lèi)世界全部被數字化的知識信息跟數據。
你從這句第一性原理中能看到,大規模的算力,大規模的數據是對AI未來(lái)發(fā)展非常重要的,而確實(shí)大規模的算力,大規模數據也是人類(lèi)過(guò)去40年芯片在互聯(lián)網(wǎng)大數據各個(gè)領(lǐng)域中不斷累積的這些技術(shù),然后去推動(dòng)AI的爆發(fā)。
大規模預訓練學(xué)習生成,整個(gè)趨勢的底層邏輯其實(shí)非常清楚了,未來(lái)會(huì )繼續高速發(fā)展,深度學(xué)習被創(chuàng )業(yè)投資行業(yè)稱(chēng)為叫做AI1.0,主要是說(shuō)它是針對一個(gè)特定的小任務(wù),用一個(gè)特定的小數據集訓練出來(lái)的一個(gè)小模型,而且主要是模式識別類(lèi),比如人臉識別語(yǔ)音識別,今天的大規模語(yǔ)音領(lǐng)域學(xué)習被我們更多稱(chēng)為是AI2.0,主要它是通用的數據訓練出來(lái)的大模型,具有生成決策能力。
AI2.0浪潮將重建整個(gè)產(chǎn)業(yè)架構
周志峰進(jìn)一步指出,AI2.0這一代新的浪潮,它會(huì )重建整個(gè)產(chǎn)業(yè)架構。整個(gè)生態(tài)架構會(huì )分為三層,最底層是基礎架構層,右邊提供算力,像aws火山引擎、阿里云等等都在提供這種計算中心平臺,右邊是工具鏈,且主要是對大模型的訓練、推理、部署做優(yōu)化。
中間這層是最重要的,一層是模型層,模型層也有幾種模式,第一種是提供這種基礎模型底座模型,然后對外去輸出模型的能力,通過(guò)API通過(guò)模型定制。
然后還有一類(lèi)是自建大模型,就他做了自己的大模型后,會(huì )針對某一個(gè)特定行業(yè)特定場(chǎng)景去做優(yōu)化,然后提供端到端的從模型到應用的解決方案。
在第三層應用層,那一種是通過(guò)自建模型直接做到垂直應用,可能80~90%的公司都是左邊這種就利用第三方模型的能力去構建自己熟悉的場(chǎng)景或者行業(yè)的一個(gè)應用,
這是我們理解的三層架構,確實(shí)這種新的架構也對整個(gè)世界去構建產(chǎn)品的形態(tài)發(fā)生很大的變化。
左邊其實(shí)是過(guò)去幾十年,不論是一輛汽車(chē)還是一個(gè)互聯(lián)網(wǎng)的社交軟件,其實(shí)都是這樣一個(gè)架構,就是產(chǎn)品經(jīng)理從用戶(hù)獲取需求,開(kāi)發(fā)者從產(chǎn)品經(jīng)理那塊獲取設計,然后用戶(hù)再把開(kāi)發(fā)出的產(chǎn)品去使用。
過(guò)去講騰訊做得好,阿里巴巴做好,講任何一個(gè)公司做得好,某種意義上是說(shuō)他把飛輪轉的最有效,而且能夠持續的去迭代飛輪。
未來(lái)企業(yè)分為兩種:+AI、AI+
談到產(chǎn)業(yè)發(fā)展,周志峰指出,未來(lái)企業(yè)分為兩種+AI、AI+。
未來(lái)更多的是把新一代的AI的能力放進(jìn)工作流,它其實(shí)是一種舊場(chǎng)景的增強。
還有一類(lèi)他會(huì )用這樣的能力全新構建一個(gè)產(chǎn)品,它其實(shí)是所謂的AI native 的一種應用,那我稱(chēng)為叫做舊場(chǎng)景的重塑,或者叫做新場(chǎng)景的創(chuàng )造。
當下,可數的非常領(lǐng)先的AI公司還是翎毛鳳角,主要是因為AI并沒(méi)有實(shí)現賦能萬(wàn)業(yè)的這樣一個(gè)真正的局面,它的產(chǎn)業(yè)化差強人意。周志峰表示:
ChatGTP重新點(diǎn)燃了AI2.0這波浪潮,你看全球的整個(gè)融資金額發(fā)生了巨大的發(fā)展,這一次會(huì )是一個(gè)依然是持續兩年,然后走低的泡沫,還是會(huì )真的一路向前,發(fā)展到一個(gè)通用人工智能,我覺(jué)得這是一個(gè)非常值得思考的問(wèn)題
大模型肯定是會(huì )變的越來(lái)越厲害,OpenAI的CEO也說(shuō),他們有可能自己去介入類(lèi)似于微軟這樣的產(chǎn)品,做一個(gè)辦公productivity產(chǎn)品,他們也在向往更廣闊的空間,我們是不是能夠找到一個(gè)自己的創(chuàng )業(yè)的黃金通道,最終走向一個(gè)廣闊的天地?
也許現實(shí)其實(shí)是這樣的,我們要走的路可能是一條死亡峽谷,兩邊都會(huì )不斷的擠壓,他們的技術(shù)都在動(dòng)態(tài)變化,我們怎么能夠穿過(guò)這條死亡峽谷,我覺(jué)得這是在創(chuàng )業(yè)時(shí)候,我們要去發(fā)揮自己的理性思維,去努力去思考的。
每一個(gè)科技浪潮一定都會(huì )誕生出新的王者,新的偉大的企業(yè)。
十大AI發(fā)展趨勢展望
展望未來(lái),啟明創(chuàng )投聯(lián)手未盡研究共同發(fā)布重磅報告《生成式AI》| State of Generative AI 2023總結出十點(diǎn)發(fā)展趨勢:
風(fēng)險提示及免責條款 市場(chǎng)有風(fēng)險,投資需謹慎。本文不構成個(gè)人投資建議,也未考慮到個(gè)別用戶(hù)特殊的投資目標、財務(wù)狀況或需要。用戶(hù)應考慮本文中的任何意見(jiàn)、觀(guān)點(diǎn)或結論是否符合其特定狀況。據此投資,責任自負。第一,以我們看到的信息啟明投資的企業(yè),我們知道在2024年甚至更早,中國一定會(huì )出現比肩GTP4的一個(gè)多語(yǔ)言模型,我們已經(jīng)很明確看到幾家企業(yè)在這個(gè)方向的進(jìn)展。
第二,long context一定會(huì )是下一代大規模語(yǔ)言模型發(fā)展的一個(gè)重點(diǎn)。我們會(huì )看到真正你可以去跟一個(gè)大模型進(jìn)行幾天幾個(gè)月的有上下文的交流,而不是今天只能聊3輪5輪就結束。
第三,我們認為做垂直大模型會(huì )有幾種,其實(shí)我們總結是5種方法。
第四,我們認為盡管今天的stabele-diffusion是非常好的diffusion模型架構,但我們相信無(wú)論是stability還是其他的公司,都會(huì )在未來(lái)的兩年內會(huì )出現一個(gè)新模式的模型。
第五,文字到圖像的模型未來(lái)將具備更強的可控性,我們已經(jīng)看到了很多業(yè)內的頂級團隊已經(jīng)在這方面有一些科研的突破。
第六,今年第三第四季度會(huì )是音樂(lè )生成的一個(gè)突破點(diǎn),我們相信在明年v6跟3D的生成會(huì )有重大突破。
第七,如何把大語(yǔ)言模型大模型去跟真正的實(shí)體空間的控制機器人,人形機器人去做結合的智能會(huì )有重大發(fā)展。
第八,transform雖然現在是主流,就像我說(shuō)的 AI的終極就是用最好的方法去壓縮全人類(lèi)的數字化的信息,transform一定不是終局,還會(huì )有更先進(jìn)的架構出現。
第九,商業(yè)角度,就是我們認為在未來(lái)三年內,模型能力與應用無(wú)法解耦,真正顛覆性的應用一定出現自那些掌握的核心底層模型研發(fā)能力的企業(yè),而不會(huì )是一家純粹做應用的公司,我指的是顛覆性應用,因為我們看不到三年內解耦的這種可能性。
第十,就是現在依然是一個(gè)可以產(chǎn)生平臺性企業(yè)的黃金期,我們相信在未來(lái)這三年中成立的一些創(chuàng )業(yè)公司會(huì )有可能成為一個(gè)千億萬(wàn)億市值的公司。
關(guān)鍵詞: