AI大模型激烈混戰!一天之內,華為、阿里、騰訊等巨頭紛紛出手
最近幾個(gè)月,國產(chǎn)大模型的內卷激烈程度可以用“神仙打架”來(lái)形容。本周五,大模型混戰又達到了新高度,據華爾街見(jiàn)聞不完全統計,僅在今天,就有華為、阿里、騰訊、商湯、京東等企業(yè)發(fā)布或更新大模型。
(資料圖片僅供參考)
“百模大戰”的盛況中,誰(shuí)最有可能造出中國版GPT-4?
華為云盤(pán)古大模型3.0正式發(fā)布
7月7日,華為云在開(kāi)發(fā)者大會(huì )2023上發(fā)布盤(pán)古大模型3.0。華為常務(wù)董事、華為云CEO張平安表示,盤(pán)古大模型3.0是完全面向行業(yè)的大模型,包括“5+N+X”三層架構。
張平安在會(huì )上表示,盤(pán)古大模型不會(huì )作詩(shī),只做事,將圍繞“行業(yè)重塑”“技術(shù)扎根”“開(kāi)放同飛”三大創(chuàng )新方向,持續打造核心競爭力,為行業(yè)客戶(hù)、伙伴及開(kāi)發(fā)者提供更好的服務(wù)。
三層架構分別為:
L0層包括自然語(yǔ)言、視覺(jué)、多模態(tài)、預測、科學(xué)計算五個(gè)基礎大模型,提供滿(mǎn)足行業(yè)場(chǎng)景中的多種技能需求。盤(pán)古3.0為客戶(hù)提供100億參數、380億參數、710參數和1000億參數的系列化基礎大模型,匹配客戶(hù)不同場(chǎng)景、不同時(shí)延、不同響應速度的行業(yè)多樣化需求。同時(shí)提供全新能力集,包括NLP大模型的知識問(wèn)答、文案生成、代碼生成,以及多模態(tài)大模型的圖像生成、圖像理解等能力,這些技能都可以供客戶(hù)和伙伴企業(yè)直接調用。無(wú)論多大參數規模的大模型,盤(pán)古提供一致的能力集。
L1層是N個(gè)行業(yè)大模型,華為云既可以提供使用行業(yè)公開(kāi)數據訓練的行業(yè)通用大模型,包括政務(wù),金融,制造,礦山,氣象等大模型;也可以基于行業(yè)客戶(hù)的自有數據,在盤(pán)古大模型的L0和L1層上,為客戶(hù)訓練自己的專(zhuān)有大模型。
L2層為客戶(hù)提供了更多細化場(chǎng)景的模型,更加專(zhuān)注于政務(wù)熱線(xiàn)、網(wǎng)點(diǎn)助手、先導藥物篩選、傳送帶異物檢測、臺風(fēng)路徑預測等具體行業(yè)應用或特定業(yè)務(wù)場(chǎng)景,為客戶(hù)提供“開(kāi)箱即用”的模型服務(wù)。
盤(pán)古大模型采用完全的分層解耦設計,可以快速適配、快速滿(mǎn)足行業(yè)的多變需求??蛻?hù)既可以為自己的大模型加載獨立的數據集,也可以單獨升級基礎模型,也可以單獨升級能力集。
在L0和L1大模型的基礎上,華為云還為客戶(hù)提供了大模型行業(yè)開(kāi)發(fā)套件,通過(guò)對客戶(hù)自有數據的二次訓練,客戶(hù)就可以擁有自己的專(zhuān)屬行業(yè)大模型。同時(shí),根據客戶(hù)不同的數據安全與合規訴求,盤(pán)古大模型還提供了公用云、大模型云專(zhuān)區、混合云多樣化的部署形態(tài)。?
阿里AIGC應用“通義萬(wàn)相”
在2023年世界人工智能大會(huì )上,阿里云正式推出AI繪畫(huà)新品“通義萬(wàn)相”。
基于阿里研發(fā)的組合式生成模型Composer,通義萬(wàn)相提出了基于擴散模型的「組合式生成」框架,通過(guò)對配色、布局、風(fēng)格等圖像設計元素進(jìn)行拆解和組合,提供了高度可控性和極大自由度的圖像生成效果。
用戶(hù)可以在通義萬(wàn)相中輸入提示詞,以輸出相應圖像。除文生圖以外,通義萬(wàn)相也推出了包括風(fēng)格遷移、相似圖生成等功能。
從此,圖片設計的門(mén)檻將大幅降低,無(wú)論是藝術(shù)設計、游戲,還是文創(chuàng ),都將迎來(lái)一場(chǎng)變革。
目前,通義萬(wàn)相具有以下三大功能:文生圖、相似圖生成、風(fēng)格遷移。
文生圖功能為基本的形式,只要輸入prompt,選定創(chuàng )作風(fēng)格(水彩、油畫(huà)、中國畫(huà)、扁平插畫(huà)、二次元、素描、3D卡通等),通義萬(wàn)相就可以自動(dòng)生成海量的創(chuàng )意靈感。通義萬(wàn)相已正式上線(xiàn),對外提供服務(wù)。
相似圖生成則可以讓用戶(hù)根據現有素材,快速地批量擴展相似素材。只要用戶(hù)提供一張參考圖像,就可以獲得一張與之內容、風(fēng)格類(lèi)似的圖像。
而風(fēng)格遷移,則是為一張原圖生成一幅指定風(fēng)格的新圖。
下圖為來(lái)自“新智元”的測試,使用通義萬(wàn)相將下圖穿著(zhù)白紗女性,改成法國印象派畫(huà)家雷諾阿的風(fēng)格。
遷移完成后,得到了這樣一幅印象派的人物肖像。
據“新智元”測評表示,通義萬(wàn)相的部分作圖能力,已經(jīng)在逼近全球最牛AI作畫(huà)神器Midjourney。
騰訊MaaS平臺升級
世界人工智能大會(huì )期間,騰訊云宣布升級MaaS平臺,將行業(yè)大模型能力應用到金融風(fēng)控、同傳翻譯、數智人客服等新場(chǎng)景中;其中,首次公布的金融風(fēng)控大模型,相比傳統風(fēng)控有10倍效率提升。
在技術(shù)底座領(lǐng)域,自研星脈高性能計算網(wǎng)絡(luò )、向量數據庫,為大模型的行業(yè)應用提供更充沛的算力基礎設施。其中,最新升級的騰訊云自研星脈高性能計算網(wǎng)絡(luò ),能提升40%的GPU利用率,節省30%~60%的模型訓練成本,為AI大模型帶來(lái)10倍通信性能提升?;隍v訊云新一代算力集群HCC,可支持10萬(wàn)卡的超大計算規模。騰訊云AI原生向量數據庫,最高支持10億級向量檢索規模,延遲控制在毫秒級,相比傳統單機插件式數據庫檢索規模提升10倍,同時(shí)具備百萬(wàn)級每秒查詢(xún)(QPS)的峰值能力。
在應用創(chuàng )新方面,騰訊云行業(yè)大模型能力應用到金融風(fēng)控、交互翻譯、數智人客服等場(chǎng)景中,極大提升了智能應用效率。
行業(yè)大模型加持的金融風(fēng)控解決方案,相比之前有了10倍效率提升,通過(guò)騰訊積累超過(guò)20年的黑灰產(chǎn)對抗經(jīng)驗和上千個(gè)真實(shí)業(yè)務(wù)場(chǎng)景,整體反欺詐效果比傳統模式有20%左右的提升。企業(yè)可以基于prompt模式,迭代風(fēng)控能力,從樣本收集、模型訓練到部署上線(xiàn),實(shí)現全流程零人工參與,建模時(shí)間也從2周減少到僅需2天。即便樣本積累有限的情況下,也可以完成快速搭建,跳過(guò)“冷啟動(dòng)”過(guò)程。
在交互翻譯領(lǐng)域,基于行業(yè)大模型技術(shù)加持,同傳技術(shù)不再需要百萬(wàn)級的訓練數據,僅需“小樣本”訓練就能實(shí)現較好效果,專(zhuān)業(yè)領(lǐng)域的翻譯也能減少人工調優(yōu)的參與,保障翻譯效果,在多個(gè)垂直行業(yè)落地。其中,騰訊同傳已經(jīng)連續六年為世界人工智能大會(huì )主論壇提供AI同傳服務(wù)。
在數智人領(lǐng)域,今年騰訊云推出了小樣本數字人工廠(chǎng),僅需少量數據、24小時(shí)內即可復刻2D數字分身,讓企業(yè)應用數智人服務(wù)成本大大降低?,F在,依托AI生成算法,數智人3D形象的復刻速度得到大幅提升,通過(guò)生成式動(dòng)作驅動(dòng),結合行業(yè)大模型能力,可讓企業(yè)獲得更“個(gè)性化、專(zhuān)業(yè)、自然逼真”的數智員工,讓“面對面”專(zhuān)業(yè)服務(wù)成為可能。
商湯大模型全面升級
世界人工智能大會(huì )期間,在“大愛(ài)無(wú)疆·日日新”人工智能論壇上,商湯科技宣布“商湯日日新SenseNova”大模型體系將多方位全面升級,以及在該體系下的一系列大模型產(chǎn)品更新和落地成果。
作為千億級參數的自然語(yǔ)言處理模型,商湯商量SenseChat 2.0版本突破了大語(yǔ)言模型輸入長(cháng)度限制,并推出不同參數量級的模型版本,可完美適配移動(dòng)端、云端等不同終端及場(chǎng)景的應用需求,降低部署成本。商湯的自研生成式大模型商湯秒畫(huà)SenseMirage 3.0的模型參數從今年4月首次發(fā)布以來(lái)的10億提升至70億量級,能夠實(shí)現專(zhuān)業(yè)攝影級的圖片細節刻畫(huà)。
不僅如此,商湯如影SenseAvatar 2.0數字人生成平臺相較1.0版本的語(yǔ)音和口型流暢度提升30%以上,實(shí)現4K高清視頻效果,并帶來(lái)AIGC生成形象及數字人歌唱功能。此外,商湯瓊宇SenseSpace 2.0的空間重建效率提升20%,渲染性能提升50%,每100平方公里場(chǎng)景的建圖時(shí)間僅需38小時(shí)即可完成(1200 TFLOPS/秒算力支持);而商湯格物SenseThings 2.0對小物體的紋理及材質(zhì)還原達到毫米級精細度,并突破對高反光和鏡面物體的采集難題。
在金融領(lǐng)域,商湯與銀行、保險、券商等客戶(hù)展開(kāi)合作,利用數字人進(jìn)行智能客服、智慧營(yíng)銷(xiāo)等工作,并通過(guò)接入大語(yǔ)言模型能力,提供投研分析、研報撰寫(xiě)等新功能,實(shí)現降本增效。此外,掛載金融知識庫后,還能100%基于客戶(hù)的產(chǎn)品說(shuō)明進(jìn)行內容問(wèn)答輸出,并實(shí)現信息及時(shí)更新。
在醫療場(chǎng)景,商湯基于海量醫學(xué)知識和臨床數據打造了中文醫療語(yǔ)言大模型“大醫”,提供導診、問(wèn)診、健康咨詢(xún)、輔助決策等多場(chǎng)景多輪會(huì )話(huà)能力,未來(lái)也即將支持醫學(xué)圖像、文本、結構化數據等多模態(tài)綜合分析,并可不斷提升醫療語(yǔ)言理解和推理能力,持續賦能醫院診療效率及患者服務(wù)提升。
其他AI企業(yè)進(jìn)展
本土AI獨角獸出門(mén)問(wèn)問(wèn)發(fā)布“序列猴子”
出門(mén)問(wèn)問(wèn)攜內測探索大模型“序列猴子”及AI CoPilot解決方案亮相世界人工智能大會(huì )。據介紹,“序列猴子”是一款具備多模態(tài)生成能力的大語(yǔ)言模型,模型以語(yǔ)言為核心的能力體系涵蓋“知識、對話(huà)、數學(xué)、邏輯、推理、規劃”六個(gè)維度,能夠同時(shí)支持文字生成、圖片生成、3D內容生成、語(yǔ)言生成和語(yǔ)音識別等不同任務(wù)?!靶蛄泻镒印本邆渥匀徽Z(yǔ)言理解、知識、邏輯以及推理等能力,并可以基于這些能力進(jìn)行對話(huà)。
京東:正在訓練大模型,對其前景很有信心
京東集團副總裁、探索研究院院長(cháng)何曉冬表示,目前訓練時(shí)間在兩個(gè)月左右的基礎通用大模型,成本估計在幾千萬(wàn)元,對大模型的商業(yè)前景和落地場(chǎng)景很有信心。他建議,創(chuàng )業(yè)公司入局大模型應該找到屬于自己的“護城河”,面對目前的“百模大戰”現狀,何曉冬認為,對于市場(chǎng)而言,有壓力和競爭是好事,將有效促進(jìn)行業(yè)發(fā)展。
風(fēng)險提示及免責條款 市場(chǎng)有風(fēng)險,投資需謹慎。本文不構成個(gè)人投資建議,也未考慮到個(gè)別用戶(hù)特殊的投資目標、財務(wù)狀況或需要。用戶(hù)應考慮本文中的任何意見(jiàn)、觀(guān)點(diǎn)或結論是否符合其特定狀況。據此投資,責任自負。關(guān)鍵詞: