懶人福音!谷歌讓機器訓練機器,用大語(yǔ)言模型定制專(zhuān)屬于你的家務(wù)機器人-環(huán)球即時(shí)
能根據你的喜好定制的家務(wù)機器人,來(lái)了!
想把深色衣服和淺色衣服分開(kāi)洗?沒(méi)問(wèn)題,機器人分分鐘就能幫你分好類(lèi):
【資料圖】
被垃圾分類(lèi)的問(wèn)題搞得焦頭爛額?沒(méi)關(guān)系,也交給機器人來(lái)做:
總之,分類(lèi)識別、定向放置……一切都憑你的習慣。
更關(guān)鍵的是,利用大語(yǔ)言模型,不需要大量數據,也無(wú)需場(chǎng)景化學(xué)習,幾句話(huà)就能輕松調教。
這款整理機器人名為T(mén)idyBot,由谷歌與美國多所高校聯(lián)合打造,通訊作者來(lái)自普林斯頓大學(xué)。
讓機器訓練機器
對于物品整理機器人的定制,最難的一環(huán)就是用戶(hù)偏好的分析。
傳統上,這類(lèi)信息需要通過(guò)海量的數據分析才能得到。
而TidyBot是使用LLM分析用戶(hù)喜好信息的。
用戶(hù)給出的具體實(shí)例,比如依據顏色將不同服飾分別放入衣柜和抽屜,會(huì )被轉換成Python風(fēng)格的LLM提示信息。
最后的概述是由LLM反饋的,具體到這個(gè)例子當中,LLM生成了如下結論:
該結論在接下來(lái)的環(huán)節中會(huì )被用于判定未知物品應該被放到哪里,前一步的輸出結果在這里作為提示的開(kāi)頭。
然后,LLM會(huì )輸出幾個(gè)新顏色襯衫和襪子的放置位置。
除了放置的位置,LLM也能分析其他操作信息,比如是需要“放”還是“扔”(下方Summary中的內容由LLM生成)。
同樣的,使用LLM總結出的信息可以判斷應對未知物體執行何種操作。
其他動(dòng)作信息原理也都相同。
有了LLM給出的信息,接下來(lái)就要應用到實(shí)際工作中了。
TidyBot的系統中預置了很多物品的分類(lèi)標簽,LLM指令的執行方式也已經(jīng)由程序設定。
TidyBot首先讓圖像識別模塊判斷出物品的基本信息,然后傳給LLM生成指令,并交付執行。
△TidyBot工作流程示意圖
由于只有極少量的數據需要進(jìn)行區分,TidyBot具有很強的魯棒性。
同時(shí),它能對來(lái)自任意用戶(hù)的任何物品進(jìn)行分類(lèi),又有很強的靈活性。
基準測試成績(jì)亮眼
除了TidyBot本身,測試基準數據集也是該團隊的另一重要貢獻。
該數據集包含了96組以文本形式描述的任務(wù)場(chǎng)景,具體包括已知和未知操作方式的物品和相應的容器。
在每個(gè)場(chǎng)景中,容器的數量為2-5個(gè),已知操作方式的物品數量為4-10個(gè),未知物品數量與已知相同。
這96個(gè)場(chǎng)景涵蓋了客廳、臥室、廚房和儲藏室四種房間類(lèi)型,每個(gè)類(lèi)型24組。
△測試數據集節選,完整版可從GitHub中獲取
實(shí)際環(huán)境中,由于對物品分類(lèi)的方式多種多樣,團隊分別從不同分類(lèi)角度對TidyBot的表現進(jìn)行了測試,具體包括:
物品大類(lèi),如“服裝”和“玩具”物品屬性,如“金屬材質(zhì)”和“塑料材質(zhì)”物品功能,如“夏裝”和“冬裝”物品子類(lèi),如“襯衫”和“其他服裝”復合類(lèi)型,如“圖書(shū)和玩具”整體上,TidyBot的準確率達到了91.2%,超過(guò)了WordNet、RoBERTa等其他方式。
具體分類(lèi)角度上的結果也是如此。
上述數據只是在理論層面對TidyBot的分類(lèi)能力進(jìn)行測試。
在實(shí)際應用中,TidyBot的表現同樣不俗。
團隊一共搭建了8個(gè)真實(shí)場(chǎng)景。
△測試使用的真實(shí)場(chǎng)景
每個(gè)場(chǎng)景各包括10件物品、2-5個(gè)容器和4-10條已知信息。
△測試中使用的容器和未知物品
每個(gè)場(chǎng)景都進(jìn)行了重復測試,最終各測試了3次,即一共10*8*3=240次操作。
在這240次操作中,TidyBot的正確率達到了85%。
最后,讓我們實(shí)際看一下TidyBot在測試中的表現吧。
位置及放置方式偏好:服裝→沙發(fā),放;木塊→抽屜,放;易拉罐→垃圾桶,扔;水果→黑色箱子,扔;零食→塑料箱,扔
本文作者:克雷西,來(lái)源:量子位,原文標題:《懶人福音!谷歌讓機器訓練機器,用大語(yǔ)言模型定制專(zhuān)屬于你的家務(wù)機器人》
風(fēng)險提示及免責條款 市場(chǎng)有風(fēng)險,投資需謹慎。本文不構成個(gè)人投資建議,也未考慮到個(gè)別用戶(hù)特殊的投資目標、財務(wù)狀況或需要。用戶(hù)應考慮本文中的任何意見(jiàn)、觀(guān)點(diǎn)或結論是否符合其特定狀況。據此投資,責任自負。關(guān)鍵詞: