全球快資訊:「AI孫燕姿」全網(wǎng)沸騰!AI翻唱大爆發(fā),整個(gè)華語(yǔ)樂(lè )壇都「復興」了
一夜之間,「AI孫燕姿」火遍全網(wǎng)。
B站上,AI孫燕姿翻唱的林俊杰「她說(shuō)」、周董「愛(ài)在西元前」、趙雷「成都」等等,讓一眾網(wǎng)友深陷無(wú)法自拔。
「冷門(mén)歌手」孫燕姿新晉成為2023年度熱門(mén)歌手,掀起許多人的追星狂歡。
【資料圖】
網(wǎng)友表示,「聽(tīng)了一晚上AI孫燕姿,出不去了......」
這些翻唱歌曲,是由Eternity丨L、羅斯特_x等UP主通過(guò)開(kāi)源項目自制后并上傳。
(作者似乎特意在「半島鐵盒」中加入了一秒空白,湊成5分20秒)
UP主:Eternity丨L
除了AI孫燕姿,還有AI周杰倫,AI王心凌、AI林志炫...
可能許多人做夢(mèng)也沒(méi)有想到,2023年華語(yǔ)樂(lè )壇竟以這種形式復興了。
「AI孫燕姿」在線(xiàn)營(yíng)業(yè)
前段時(shí)間,一位TikTok網(wǎng)友用AI創(chuàng )作了一首「Heart on My Sleeve」很快躥紅網(wǎng)絡(luò ),引來(lái)1000多萬(wàn)人圍觀(guān)。
聽(tīng)完這首歌的網(wǎng)友紛紛表示,太讓我驚訝了,簡(jiǎn)直太瘋狂!
這首歌正是用兩位美國流行音樂(lè )人Drake和The Weeknd的聲音創(chuàng )作而成。先通歌手聲音訓練AI,然后再用AI來(lái)創(chuàng )作。
在國內,B站上AI翻唱的華語(yǔ)樂(lè )壇歌曲也漸漸成為許多人關(guān)注的焦點(diǎn),孫燕姿、王心凌、周杰倫等明星紛紛「復出」。
而最火的莫過(guò)于孫燕姿,憑借「天后音色」的稱(chēng)號,直接成為AI新寵兒。
UP主:羅斯特_x
有人還自制了AI孫燕姿粵語(yǔ)版《愛(ài)來(lái)的太遲》。
然而,對于A(yíng)I音樂(lè )制作,在整個(gè)音樂(lè )行業(yè)并非是一個(gè)新事物了。只不過(guò)生成式AI的大火,讓AI翻唱的門(mén)檻再次被拉低。
比如,年初,谷歌還曾推出了文本到音樂(lè )模型MusicLM,通過(guò)將音樂(lè )的生成過(guò)程視為分層的序列到序列建模任務(wù),并以24 kHz的頻率生成高保真的音樂(lè )。
對于許多歌迷來(lái)講,AI翻唱一定程度上滿(mǎn)足了自己的許多遐想。
還有一些歌迷,自己訓練了已故經(jīng)典老歌手的AI,包括阿桑、張國榮、姚貝娜、鄧麗君等等。
這或許是一種數字永生,通過(guò)這樣一種方式讓久違的聲音再次回到人們心里。
Midjourney出圖逼真的超強能力,讓人們驚呼畫(huà)家要失業(yè)了。對于A(yíng)I翻唱,難道歌手也要被去取代嗎?
一位UP主@阿張Rayzhang用自己的音色訓練出的AI唱Killer Queen后,瞬間感覺(jué)太恐怖了。
緊急錄制一個(gè)視頻后,并附上了「AI歌手會(huì )讓翻唱區集體失業(yè)嗎?我被AI版的我爆殺!」標題。
有網(wǎng)友稱(chēng),自己就是AI第一批受害者畫(huà)手,感覺(jué)什么職業(yè)也逃不掉。
有些人也表示,翻唱的有些地方一點(diǎn)也不像。
要知道,對于A(yíng)I翻唱來(lái)講,也需要豐富的特定藝術(shù)家音色訓練數據,這樣AI生成的作品才更加真實(shí)。
就目前的技術(shù),雖然歌手的唱腔、技巧和風(fēng)格等還不能完全模仿,但音色已經(jīng)基本能完全復刻。
但是真正的大家是不能被取代。
AI翻唱火雖火,但由AI創(chuàng )作音樂(lè )的另一面,是迫在眉睫的版權問(wèn)題。
AI創(chuàng )作的「Heart on My Sleeve」在TikTok上風(fēng)靡一時(shí)后,完整版被上傳到了Apple Music、Spotify、YouTube等平臺上。
就此,美國歌手Drake對此在Ins表達了不滿(mǎn),「這是(壓死駱駝的)最后一根稻草了」。目前,這首歌因為侵權問(wèn)題已經(jīng)下架。
《金融時(shí)報》稱(chēng),擁有Taylor Swift、Bob Dylan等巨星版權的環(huán)球音樂(lè )集團,正敦促Spotify和蘋(píng)果阻止AI工具從其藝術(shù)家的版權歌曲中抓取歌詞和旋律。
但是有些藝術(shù)家卻不吝嗇自己的聲音,馬斯克前女友Grimes在網(wǎng)上表示,
「任何人都可以使用我的聲音AI生成歌曲?!共贿^(guò),還得再付50%的版權。
而這次大火的AI翻唱背后的原始項目「so-vits-svc」的作者,據稱(chēng)也是因為太多人濫用,而刪除了項目。
SoVitsSvc:唱歌聲音轉換
項目地址:https://github.com/svc-develop-team/so-vits-svc
歌聲轉換模型使用SoftVC內容編碼器來(lái)提取源音頻語(yǔ)音特征,然后將向量直接送入VITS,而不是轉換為基于文本的中間格式。因此,音高和音調都可以被保留下來(lái)。
此外,項目開(kāi)發(fā)者還通過(guò)采用NSF HiFiGAN作為聲碼器(vocoder),從而解決了聲音中斷的問(wèn)題。
· 特征輸入改為Content Vec · 采樣率統一使用44100Hz?
· 由于參數的改變,以及模型結構的精簡(jiǎn),推理所需的GPU顯存明顯減少。?
· 增加選項1:vc模式的自動(dòng)音高預測,這意味著(zhù)在轉換語(yǔ)音時(shí)不需要手動(dòng)輸入音高鍵,男聲和女聲的音高可以自動(dòng)轉換。但是,這種模式在轉換歌曲時(shí),會(huì )造成音高偏移。?
· 增加選項2:通過(guò)k-means聚類(lèi)方案減少音色泄漏,使音色與目標音色更相似。?
· 增加選項3:增加NSF-HIFIGAN增強器,對一些訓練集少的模型有一定的音質(zhì)增強效果,但對訓練好的模型有負面影響,所以默認關(guān)閉。
預訓練模型文件
將checkpoint_best_legacy_500.pt放在hubert目錄下。
將G_0.pth和D_0.pth放在logs/44k目錄下。
預處理
0. 音頻切片
利用audio-slicer-GUI或audio-slicer-CLI工具,將原始音頻切片至5秒-15秒。
長(cháng)一點(diǎn)也沒(méi)問(wèn)題,但太長(cháng)(比如30秒)可能會(huì )在訓練甚至預處理時(shí)導致「torch.cuda.OutOfMemoryError」,俗稱(chēng)爆顯存。
切片后,刪除過(guò)長(cháng)和過(guò)短的音頻。
1. 重采樣至44100Hz和單聲道
python resample.py
2. 自動(dòng)將數據集分成訓練集和驗證集,并生成配置文件
python preprocess_flist_config.py
3. 生成hubert和f0
python preprocess_hubert_f0.py
完成上述步驟后,dataset目錄將包含預處理的數據,dataset_raw文件夾可以被刪除。
現在,你可以修改生成的config.json中的一些參數——
keep_ckpts:在訓練中保留最后的keep_ckpts模型。設置為0將保留所有模型,默認是3。
all_in_mem:將所有數據集加載到RAM中。當某些平臺的磁盤(pán)IO太低,而系統內存比你的數據集大得多時(shí),可以啟用。
訓練
python train.py -c configs/config.json -m 44k
推理
模型在需要使用「inference_main.py」。
舉個(gè)例子:
python inference_main.py -m "logs/44k/G_30400.pth" -c "configs/config.json" -s "nen" -n "君の知らない物語(yǔ)-src.wav" -t 0
雖然原始項目組現已停止維護,但有不少網(wǎng)友都進(jìn)行了fork并且也做了一些更新。
比如下面這個(gè)圖形化界面:
項目地址:https://github.com/voicepaw/so-vits-svc-fork
AI「復活」
AI翻唱之外,許多網(wǎng)友此前曾做了類(lèi)似的項目,比如「AI-Talk」讓馬斯克和喬布斯進(jìn)行了穿越時(shí)空的對話(huà)。
視頻中,AI不但模擬了他們的聲音,還在一定程度上模擬了其對話(huà)思路,使得交流過(guò)程十分流暢。
AI讓我們與逝者的對話(huà)成為可能。此前,B站UP主用AI還復活了老奶奶。
對于老奶奶的聲音制作,直接把過(guò)去已有的音頻上傳,素材基本來(lái)自于過(guò)去的電話(huà)錄音、錄像視頻或者微信語(yǔ)音。
并用音頻編輯軟件AU進(jìn)行調整,調整的方向主要在降噪、人聲增強等等。
然后將更加清晰的音頻樣本切割成若干秒的短句,方便進(jìn)行標注。最后將處理好的音頻打包放入語(yǔ)音合成系統中去。
利用語(yǔ)音合成系統,就可以嘗試輸入文本轉語(yǔ)音了。
網(wǎng)友見(jiàn)證科技狠活
AI孫燕姿的歌,已經(jīng)唱到許多網(wǎng)友的心坎。
最近沉迷AI「翻唱」,上至AI侃爺唱罰酒,下至蘇小玎唱真相是真。但說(shuō)句正經(jīng)的,確實(shí)還是AI屆頂流孫燕姿的翻唱最好聽(tīng)。
這幾天沉迷B站的AI孫燕姿,剛剛聽(tīng)了一首《一場(chǎng)游戲一場(chǎng)夢(mèng)》,太好聽(tīng)了,唱到心坎里
不少網(wǎng)友聽(tīng)過(guò)AI翻唱的歌曲后,感受到AI歌手的可怕之處:
科技的力量真是讓人細思極恐。
深深感受到了什么叫做科技的力量......
這就是AI生命,數字飛升!
還有網(wǎng)友對逝去歌手的懷念。
本文作者:新智元,本文來(lái)源:新智元,原文標題:《「AI孫燕姿」全網(wǎng)沸騰!AI翻唱大爆發(fā),整個(gè)華語(yǔ)樂(lè )壇都「復興」了》
風(fēng)險提示及免責條款 市場(chǎng)有風(fēng)險,投資需謹慎。本文不構成個(gè)人投資建議,也未考慮到個(gè)別用戶(hù)特殊的投資目標、財務(wù)狀況或需要。用戶(hù)應考慮本文中的任何意見(jiàn)、觀(guān)點(diǎn)或結論是否符合其特定狀況。據此投資,責任自負。關(guān)鍵詞: