為什么說(shuō)邊緣計算有望成就高通的“算力夢(mèng)” 即時(shí)焦點(diǎn)
6月2日,邊緣計算概念股持續活躍,美格智能強勢漲停。
此前高通公司高級副總裁表示,高通正在從一家通信公司過(guò)渡到一家邊緣計算公司。
【資料圖】
國盛證券指出,與英偉達在計算能力相對應,高通在全球通信領(lǐng)域處于霸主地位,無(wú)論是從決定無(wú)線(xiàn)通信能力的基帶產(chǎn)品,亦或是決定手機性能的手機芯片,高通都擁有絕對的全球領(lǐng)先地位。而隨著(zhù)“算力”成為AI時(shí)代的最寶貴資源,高通不滿(mǎn)足于“通信”能力的領(lǐng)先,而是希望依靠通信能力和終端設備布局,從邊緣側進(jìn)軍被英偉達覆蓋的算力領(lǐng)域。
國盛證券認為,隨著(zhù)AI刺激下,算力加速走向“泛在”,高通有望憑借其手機芯片,物聯(lián)網(wǎng)芯片、通信芯片三大能力,成為邊緣算力的“英偉達”。
國信證券還提到,目前具備運行優(yōu)化模型能力的終端僅限頭部品牌旗艦手機,隨著(zhù)AI大模型在邊緣端落地,有望推動(dòng)新一輪換機潮。
邊緣算力優(yōu)勢
邊緣算力,通常指部署在設備本地的算力或者離用戶(hù)距離較近的數據中心中的算力,邊緣算力相較于云端算力,擁有低成本、低時(shí)延、高隱私三大特性。
1)低成本:當前主流的邊緣算力平臺主要采用高通主導下的ARM架構,相比于英偉達的復雜架構,ARM架構在小算力時(shí)擁有極低的單位成本,是降低開(kāi)發(fā)與用戶(hù)成本的必然選擇。
2)低時(shí)延:邊緣算力一般搭載在本地,無(wú)需將數據發(fā)送至云端并等待回傳的時(shí)間,可以滿(mǎn)足如自動(dòng)駕駛,快速對話(huà)等對時(shí)延要求高的場(chǎng)景。
3)高隱私:邊緣算力依靠設備本身搭載的算力或在用戶(hù)自有服務(wù)器上的算力進(jìn)行推理,可以實(shí)現數據不出用戶(hù)管轄范圍,對隱私的保護更好。
當下邊緣算力主要有兩種存在模式,一種是設備本身搭載的算力,這類(lèi)算力通常依托邊緣處理芯片存在,邊緣處理芯片包括了手機終端上的驍龍與蘋(píng)果M平臺,面向IOT設備的如高通8155芯片或者專(zhuān)為AI優(yōu)化的QCM8550芯片。通常,大單品采用直采芯片+定制PCB的形式進(jìn)行開(kāi)發(fā),而中小廠(chǎng)商與細分垂直領(lǐng)域往往采購模組來(lái)滿(mǎn)足算力需求。
第二種算力存在形式是邊緣資源池,通常由離用戶(hù)較近的核心城市內的數據中心構成,或者由廠(chǎng)區,道路旁的小機柜、算力盒子提供算力。
AI生態(tài)中最重要的組成部分之一
國盛證券指出,當前市場(chǎng)普遍聚焦于云端算力發(fā)展,忽視了邊緣算力在A(yíng)I乃至社會(huì )數字化發(fā)展中的重要地位。隨著(zhù)AI大模型應用逐漸滲透進(jìn)入千行百業(yè)和各類(lèi)垂直細分場(chǎng)景,單純的大規模計算中心提供的算力將不能滿(mǎn)足多樣化的AI運算需求,其認為邊緣算力具備不可或缺性:
第一,未來(lái)隨著(zhù)計算芯片加速發(fā)展,單位算力成本中,電費與土地費用占比將愈發(fā)提升,算力成本將取決于智算中心的地理位置,以我國舉例,未來(lái)算力成本較低的西部將是云端算力主要部署地。因此,大算力與低時(shí)延需求將出現錯配。
第二,AI模型推理Token費用較貴,如果需要成熟商用,邊緣預處理將是必須選項。通過(guò)邊緣部署的算力,將用戶(hù)的多樣化需求進(jìn)行本地的預處理,簡(jiǎn)單的需求直接利用本地模型和算力推理,復雜需求通過(guò)邊緣算力預處理后,精簡(jiǎn)成最少的TOKEN發(fā)送至云端,從而能夠最低成本的實(shí)現應用功能,加速商業(yè)化。
最后,無(wú)論是對用戶(hù)個(gè)人敏感數據進(jìn)行推理,還是推理設計商業(yè)敏感數據,完全與云端隔絕的邊緣算力,能為用戶(hù)提供最好的數據安全保護。
國盛證券表示,在生成式AI爆發(fā)前,邊緣算力已經(jīng)逐漸滲透進(jìn)了部分商用場(chǎng)景,如手機云游戲、無(wú)人設備駕駛、自動(dòng)視頻識別等。如今隨著(zhù)MLC-LLM,谷歌模型體系等軟件基建加速,特斯拉機器人為具身智能完成物理基建,在終端設備上推理生成式模型,甚至讓智能設備同物理世界自主交互的條件已經(jīng)具備,未來(lái)隨著(zhù)應用加速滲透、預處理模型需求爆發(fā),以及邊緣小模型推理,智能設備物理交互需求爆發(fā)。
邊緣端落地有望推動(dòng)新一輪換機潮
國信證券還提到,AI部署本地化具有必要性,優(yōu)勢包括更低的延遲、更小的帶寬、提高數據安全、保護數據隱私、高可靠性等。完整的大模型僅參數權重就占滿(mǎn)一張80G的GPU,但是通過(guò)量化、知識蒸餾、剪枝等優(yōu)化,大模型可以在手機本地實(shí)現推理。
其指出,不過(guò)目前具備運行優(yōu)化模型能力的終端僅限頭部品牌旗艦手機。
根據目前各家公司對于邊緣端部署的情況推測,即使經(jīng)過(guò)量化、剪枝、蒸餾等方式優(yōu)化大模型后,仍然需要旗艦版的手機芯片可以勉強承載運行。
假設旗艦機型主處理器頻率應在2.8GHz以上,或是價(jià)格在1000美金以上,根據IDC數據,1Q23全球手機銷(xiāo)量中主處理器頻率超過(guò)2.8GHz的占比36%,銷(xiāo)售價(jià)格在1000美金以上的手機銷(xiāo)量占比13%。
國信證券,隨著(zhù)AI大模型在邊緣端落地,有望推動(dòng)新一輪換機潮。
風(fēng)險提示及免責條款 市場(chǎng)有風(fēng)險,投資需謹慎。本文不構成個(gè)人投資建議,也未考慮到個(gè)別用戶(hù)特殊的投資目標、財務(wù)狀況或需要。用戶(hù)應考慮本文中的任何意見(jiàn)、觀(guān)點(diǎn)或結論是否符合其特定狀況。據此投資,責任自負。關(guān)鍵詞: