国产精品久久久久久久久久久久午衣片,无码AV大香线蕉伊人久久蜜臀,欧美日韩亚洲中文字幕三,欧美日韩精品成人网视频

您的位置：首頁(yè) > 要聞 >

環(huán)球微資訊！AI開(kāi)始為數字人注入靈魂

來(lái)源：第一財經(jīng) ? 2023-05-17 20:02:56

這幾天，國內“冷門(mén)歌手”憑借AI翻唱再度走紅。

B站網(wǎng)友用AI模型生成了歌手孫燕姿的AI分身，其實(shí)跟車(chē)載導航上的“林志玲”、“郭德綱”類(lèi)似。拿歌手本人的音頻去訓練，生成一個(gè)音色一模一樣的“孫燕姿”。

然后，讓偶像唱自己喜歡的歌的心愿，就以這樣一種詭異的方式實(shí)現了。

(相關(guān)資料圖)

海外的玩法更加離譜。

美國一個(gè)擁有180萬(wàn)粉絲的23歲女網(wǎng)紅，通過(guò)用GPT-4復刻了自己的AI分身，然后同時(shí)與1000多個(gè)網(wǎng)友談戀愛(ài)，每分鐘收費1美元。

僅一周，她就狂賺了7.16萬(wàn)美元。

并且還遠不止如此，現在她的“男友”還在急速增加中，目前已經(jīng)增加到了近萬(wàn)人，排隊等待與她“談戀愛(ài)”時(shí)間已經(jīng)長(cháng)達96小時(shí)。

有分析認為，按照趨勢，她月入500萬(wàn)美元沒(méi)有任何難度，如果不是技術(shù)限制，她賺到的錢(qián)，將可能是一個(gè)天文數字。

這些現象已經(jīng)可以充分說(shuō)明，一個(gè)由AI+帶來(lái)的新技術(shù)紅利時(shí)代，正在被急速到來(lái)。

01 數字人軍團涌入直播間

直播帶貨是虛擬IP變現最具潛力的場(chǎng)景。

Z世代對社交、視頻、網(wǎng)購等工具的使用深度遙遙領(lǐng)先于全網(wǎng)平均水平，數字人和虛擬空間結合的新玩法給他們帶來(lái)了體驗感和交互性，虛擬IP的核心粉絲大多來(lái)自18-24歲的年輕群體。

這一趨勢讓品牌方看到了讓產(chǎn)品打破圈層的機會(huì )。

2020年，虛擬歌手洛天依和樂(lè )正綾等來(lái)到淘寶直播間，為博士倫、美的、歐舒丹等品牌帶貨。這場(chǎng)直播觀(guān)看人數高達270萬(wàn)，有近200萬(wàn)人打賞互動(dòng)。

這在當時(shí)一度掀起巨大的討論，虛擬數字人直播的時(shí)代已經(jīng)來(lái)了。

而隨著(zhù)今年由chatGPT掀起的人工智能大模型熱潮，虛擬數字人領(lǐng)域又迎來(lái)一輪更加磅礴的爆發(fā)。

一大批量的虛擬數字人開(kāi)始扎堆涌進(jìn)直播間。

今年4月份，天娛數科旗下的虛擬數字人“朏朏”已完成 ChatGPT 模型接入，并完成直播首秀，不僅能夠實(shí)時(shí)響應顧客的提問(wèn)，還能根據不同問(wèn)題進(jìn)行自主回答。

在短視頻上，出現過(guò)很多這樣的場(chǎng)景：一家公司的整個(gè)辦公室里空無(wú)一人，只有一排排辦公桌上有數十臺電腦屏幕里的AI美女們正在直播......

圖源：短視頻

這家公司，只靠2D超寫(xiě)實(shí)的虛擬形象，提前準備好的話(huà)術(shù)和背景，就可以直播一天，雖然單個(gè)效果不如真人直播，但成本低到令人發(fā)指，而且還可以超低成本復制，勝在以量取勝，真正是做到躺著(zhù)讓AI掙錢(qián)也并非不可能。

這一切，在說(shuō)明，一場(chǎng)基于“AI+”的內容效率革命，正在數字人領(lǐng)域爆發(fā)。

虛擬數字人根據制作技術(shù)、應用場(chǎng)景、形象特點(diǎn)分為很多種。

與3D人氣偶像不同，現在大多數直播間里說(shuō)話(huà)的根據真人原型復刻聲音、表情的2D寫(xiě)實(shí)數字人，你根本分辨不出是真是假，但制作成本遠低于勇闖娛樂(lè )圈的A-Soul IP們。

一個(gè)虛擬主播可以進(jìn)行7*24全天候的直播工作，隨叫隨到，也不用擔心人設翻車(chē)的問(wèn)題，減少了直播運營(yíng)中的人工成本。

這背后，是AIGC在重新塑造數字人的生產(chǎn)流程。

2D數字人的制作用上了深度學(xué)習，只需要確定形象設計，圖文音頻數據經(jīng)過(guò)采集、預處理后上傳到模型訓練，制作方式相對3D更簡(jiǎn)單，更標準化，制作效能不斷提升。

這種工廠(chǎng)流水線(xiàn)的方式，使數字人的制作門(mén)檻、成本和周期得到了大幅縮短。

同時(shí)，隨著(zhù)行業(yè)制作端的技術(shù)迭代和成本驟降，針對小型客戶(hù)的數字人解決方案也開(kāi)始涌現。

在4月份，騰訊云發(fā)布的數字人生產(chǎn)平臺，需要生成真人形象的數字分身可以在平臺上采購服務(wù)，只需上傳圖像音視頻即可實(shí)現定制，根據不同音色、視頻時(shí)長(cháng)收費。

除了制作數字人，還可以提供整套數字人直播解決方案，功能包括了真人音頻接管直播間，獲取用戶(hù)評論智能回復，定價(jià)僅需要千元級別。

而有些渠道商，打包售賣(mài)AI主播的定價(jià)甚至只要200元以?xún)取?/p>

這些主播形象大多來(lái)自模特經(jīng)紀公司的授權，投放質(zhì)量雖然粗糙，摳圖痕跡明顯，聲音也沒(méi)有特點(diǎn)。

但對普通的中小企業(yè)來(lái)說(shuō)，沒(méi)有大V帶貨，花不起上百萬(wàn)定制高端IP，想要壓縮運營(yíng)成本，快速起量，幾千塊的數字人已經(jīng)夠香了。

企業(yè)如果想要自己修改代碼，產(chǎn)出不同的數字人，還可以向技術(shù)提供商購買(mǎi)源碼，售價(jià)要比直接買(mǎi)AI主播更貴，不僅能自用，還可以使用源碼發(fā)展代理，甚至比自己做數字人直播還賺錢(qián)。

但AI數字人的故事，還沒(méi)有講完。

02 AI注入靈魂

IDC在《中國AI數字人市場(chǎng)現狀與機會(huì )分析》報告中將數字人分為五個(gè)等級，目前數字人發(fā)展經(jīng)歷從手工制作到AI建模的階段，初步具備人的外形，但還只能做簡(jiǎn)單的交互決策。

當智能化水平來(lái)到L4、L5級別時(shí)，AI驅動(dòng)的數字人能夠接管大多數場(chǎng)景決策，支持更多模態(tài)的實(shí)時(shí)交互，類(lèi)似鋼鐵俠的私人AI管家“賈維斯”。

虛擬數字人過(guò)去三十年的發(fā)展，技術(shù)發(fā)展和市場(chǎng)需求基本圍繞著(zhù)兩點(diǎn)在演變，一是視覺(jué)效果；二是交互體驗。

虛擬數字人最早出現在游戲、動(dòng)漫、電影里，對新潮事物的情感連接和IP價(jià)值的延伸遙相呼應。

早期的角色型IP使用手繪，動(dòng)作要一張一張地畫(huà)。1982年，日本動(dòng)畫(huà)《超時(shí)空要塞》的女主角林明美成為了首個(gè)發(fā)行音樂(lè )專(zhuān)輯的虛擬歌手。

在電影里，形象可以用計算機建模，但動(dòng)作還得讓人來(lái)做，CG技術(shù)和動(dòng)作捕捉等技術(shù)逐漸普及，依靠綠幕，捕捉設備，演員可以成為任何角色。

千禧年后，從02年的《指環(huán)王》到去年的《阿凡達2》，角色的渲染效果已經(jīng)細致入微，為藝術(shù)創(chuàng )作帶來(lái)了巨大便利。

到這里，數字人技術(shù)的發(fā)展圍繞更像“人”的極限一步步逼近，不僅僅要求外觀(guān)、服裝上的視覺(jué)效果趨近真實(shí)，還包括驅動(dòng)（呈現真實(shí)細膩的表情和動(dòng)作）和渲染（讓畫(huà)面更加精細實(shí)時(shí)）。

不過(guò)，總覺(jué)得還是缺了點(diǎn)什么。

1970 年，日本機器人專(zhuān)家森昌弘提出“恐怖谷”理論，由于機器人與人類(lèi)在外表、動(dòng)作上相似，所以人類(lèi)會(huì )對機器人產(chǎn)生正面的情感。

當機器人與人類(lèi)的相似程度達到一個(gè)特定程度的時(shí)候，一點(diǎn)點(diǎn)的差別都會(huì )被放大，并帶來(lái)負面和反感情緒。而當機器人與人類(lèi)的相似度繼續上升，人類(lèi)對其情感會(huì )再度回到正面。

與電影不同，社交屬性更強的應用場(chǎng)景對數字人實(shí)時(shí)交互的要求更高，不只是滿(mǎn)足于制作一個(gè)好看的“花瓶”而已。

在交互方面，自然語(yǔ)言模型填補了這一空缺。

文本生成能力已經(jīng)驚艷眾人的GPT，給數字人的“智商”加上了兩道杠。

NLP大模型是AI驅動(dòng)虛擬人的技術(shù)基石，簡(jiǎn)單來(lái)講就是讓虛擬數字人能說(shuō)會(huì )道，減少標準化內容的制作成本，被訓練來(lái)?yè)沃悄芸头?、主持人、導游等角色。長(cháng)期來(lái)看，隨著(zhù)個(gè)性化和情感理解的能力提高，為老人提供陪伴關(guān)懷，成為小孩子的”私人教師“也將實(shí)現。

此外，嘴型動(dòng)作也可以由AI驅動(dòng)，建立起與文本的映射關(guān)系，隨著(zhù)寫(xiě)實(shí)程度的提高，微表情也就更豐富，說(shuō)話(huà)的時(shí)候表情、口型能夠對得上，這樣的數字人不僅“形似人”，而且“神似人”。

Midjourney是基于diffusion model擴散模型的爆款產(chǎn)品，在去年7月發(fā)布，通過(guò)文本輸入指令訓練AI繪畫(huà)。

有機構測算過(guò)，目前其年收入就已經(jīng)能夠達到1億美元的規模。

有B站up主用Midjourney復原了奶奶的寫(xiě)實(shí)形象，從外觀(guān)上看，衰老的皮紋和白頭發(fā)細節感十足，加上過(guò)去的音頻重現奶奶的聲音，最后通過(guò)D-ID生成了奶奶的數字分身。

為了彌補未與奶奶好好告別的小遺憾，孫子和眼前的數字“奶奶”開(kāi)啟了對話(huà)，而“奶奶”親切地回應，其實(shí)是ChatGPT提供的回答素材。

圖源：B站

正是通過(guò)這些用戶(hù)端的越來(lái)越多的嘗試，反過(guò)來(lái)為AI的“人格化”不斷添加海量訓練素材，加速豐富AI模型數據，最終讓AI為數字人注入靈魂，帶來(lái)更大可能。

03 尾聲

對虛擬分身的探索至今持續了三十余年，從手繪到真人驅動(dòng)，再到AI驅動(dòng)，擬真感和交互性的體驗進(jìn)步打開(kāi)了廣闊的應用場(chǎng)景，涓流匯成大海。

AIGC幫助將普通人的外觀(guān)、聲音等特征全面數字化，更低的制作門(mén)檻打開(kāi)了市場(chǎng)的想象空間。

IDC預計，到2026年中國AI數字人市場(chǎng)規模將達到102.4億元人民幣，但能夠給我們帶來(lái)多么良好的體驗，決定了數字人最終的命運。

同時(shí)，AI數字人具備下一代人機交互入口的潛質(zhì)，未來(lái)我們面對的或不再是冰冷的屏幕，而是生動(dòng)活潑的數字人類(lèi)，越能夠挖掘最深層次的情感需求，成為我們生活里的參與者。

或許正如AI教父所言，人類(lèi)只是智慧演化的過(guò)渡階段，以便創(chuàng )造出數字智能，如今我們終于有一個(gè)長(cháng)得像人類(lèi)的數字分身，像我們一樣說(shuō)話(huà)，以后或許還能像我們一樣思考。

關(guān)鍵詞：