OpenAI重磅研究:ChatGPT可能影響80%工作崗位,收入越高影響越大
ChatGPT 來(lái)了,失業(yè)還會(huì )遠嗎?上星期在 GPT-4 發(fā)布時(shí),ChatGPT 第一時(shí)間上線(xiàn)了新版本,OpenAI 首席執行官 Sam Altman 表示他對自家這種技術(shù)「有點(diǎn)害怕」。
(資料圖片)
和很多專(zhuān)家一樣,Altman 擔心人工智能技術(shù)的強大能力會(huì )制造過(guò)多虛假信息,另一方面,新技術(shù)也將改變經(jīng)濟、勞動(dòng)力和教育環(huán)境。
有人開(kāi)玩笑說(shuō) Sam Altman 每天背著(zhù)的同一個(gè)包,里面有緊急關(guān)停 AI 的紅色按鈕。
此前,AI 作畫(huà)已經(jīng)讓很多畫(huà)師開(kāi)始擔憂(yōu)自己的工作會(huì )被取代。昨天,OpenAI 研究人員提交的一篇報告引發(fā)了人們更加熱烈的討論,研究人員估計 ChatGPT 和使用該程序構建的未來(lái)應用可能影響美國大約 19% 的工作崗位,和他們至少 50% 的工作任務(wù)。
與此同時(shí),80% 的美國勞動(dòng)力至少有 10% 的工作任務(wù)在某種程度上將受到 ChatGPT 的影響。
該研究分析表明,像 GPT-4 這樣的 LLM(大型語(yǔ)言模型)的影響可能是無(wú)處不在的。此外,工資較高的工作 —— 可能需要執行許多基于軟件的任務(wù) —— 會(huì )面臨更多來(lái)自人工智能聊天機器人的潛在影響。
在職業(yè)影響方面,受影響最大的職業(yè)包括翻譯工作者、作家、記者、數學(xué)家、財務(wù)工作者、區塊鏈工程師等。
該研究還按行業(yè)細分了 ChatGPT 的影響。數據處理托管、出版業(yè)等行業(yè)最有可能受到影響。相比之下,體力勞動(dòng)較多的行業(yè) —— 食品、林業(yè)、社會(huì )援助等受到的潛在影響最小。
OpenAI 研究了美國超過(guò) 1000 個(gè)職業(yè),并給他們貼上了執行這些工作所需的各種任務(wù)的標簽。然后,研究人員使用人工注釋器和 GPT-4 模型來(lái)評估訪(fǎng)問(wèn)由 ChatGPT 驅動(dòng)的系統是否會(huì )將人類(lèi)執行特定任務(wù)所需的時(shí)間減少至少 50%。
讓我們看看這項研究具體在干什么:
研究介紹
我們先看總結,OpenAI 本次調查了 GPT 模型和相關(guān)技術(shù)對美國勞動(dòng)力市場(chǎng)的潛在影響。他們根據人員職業(yè)與 GPT 能力的對應程度來(lái)進(jìn)行評估,研究結果表明,大約 80% 的美國勞動(dòng)力至少有 10% 的工作任務(wù)會(huì )受到 GPT 的引入影響,而大約 19% 的員工可能會(huì )看到至少 50% 的工作任務(wù)受到影響。這種影響涵蓋所有工資水平,高收入工作可能面臨更大的風(fēng)險。值得注意的是,這種影響不僅限于近期生產(chǎn)率增長(cháng)較高的行業(yè)。
通過(guò)分析他們發(fā)現,像 GPT-4 這樣的大型語(yǔ)言模型帶來(lái)的影響可能是普遍的。隨著(zhù)時(shí)間的推移,LLM 的能力不斷提高,即使現在研究人員停止對新模型能力的開(kāi)發(fā),但它們帶來(lái)日益增長(cháng)的經(jīng)濟效應也會(huì )持續增長(cháng)。該研究還發(fā)現,如果考慮到互補技術(shù)的發(fā)展,LLM 的潛在影響將顯著(zhù)擴大。這也恰恰說(shuō)明了 GPT 正變得越來(lái)越通用。
為了分析,該研究還提出了一個(gè)新的標準來(lái)理解 LLM 的能力及其對工作潛在影響,該標準用來(lái)衡量關(guān)于 GPT 任務(wù)的總暴露數。
看完結論,接下來(lái)就該介紹數據集了。該研究使用 O*NET 27.2 數據集 (O*NET, 2023),該數據集包含 1016 個(gè)職業(yè)信息,表 1 提供了數據集示例,包含任務(wù) ID、職位等。
此外,數據集還包括他們從美國勞工統計局獲得的 2020 年 - 2021 年員工就業(yè)和工資數據。該數據集包括職業(yè)頭銜、每種職業(yè)的工人數量等。
在方法上,該研究根據 exposure rubric 來(lái)展示結果,Exposure rubric 定義為訪(fǎng)問(wèn) GPT 或 GPT 驅動(dòng)的系統是否會(huì )將人類(lèi)執行特定 DWA 或完成任務(wù)所需的時(shí)間減少至少 50%。(注:DWA 全稱(chēng) Detailed Work Activities ,可以將其理解為完成任務(wù)所需要的動(dòng)作,例如表 1,對于計算機系統工程師,其 DWA 包括監控電腦系統性能,確保正常運作。)
該研究對每個(gè) O*NET 數據集的 DWA 和所有 O*NET 任務(wù)的子集獲得人工注釋?zhuān)缓笤谌蝿?wù)和職業(yè)級別上匯總這些 DWA 和任務(wù)得分。為了確保這些注釋的質(zhì)量,該研究親自標記了大量任務(wù)和 DWA 樣本,并招募了經(jīng)驗豐富的人工注釋者,他們在 OpenAI 的對齊工作中廣泛審查了 GPT 輸出。
下表為模型與人的一致性比較與皮爾遜相關(guān)系數。一致性分數是通過(guò)觀(guān)察兩組人在注釋上達成一致的頻率來(lái)確定的 (例如 E0, E1 或 E2)。在本文中,該研究使用 GPT-4, Rubric 1。
該研究為感興趣的因變量構建了三個(gè)主要度量:(i) ????,對應于上面 exposure rubric 中的 E1, (ii) ????,是 E1 和 0.5*E2 的總和,以及 (iii) ????,E1 和 E2 的總和。該研究在表 2 中總結了注釋組和度量之間的一致性。
研究結果
OpenAI 的這項研究以 GPT 語(yǔ)言模型對經(jīng)濟具有普遍影響作為假設,我們來(lái)看一下具體的研究結果。
根據 ???? 值,該研究估計 80% 的人屬于至少一項工作任務(wù)受 GPT 影響的職業(yè),而 19% 的人所處的職業(yè)有超過(guò)一半的工作任務(wù)被標記為受到 GPT 影響。
工資和就業(yè)
下圖 3 描繪了 GPT 模型對經(jīng)濟的整體影響。
下圖 4 描繪了工作薪資與對 GPT 等語(yǔ)言模型接觸使用情況的關(guān)系。
然后,該研究又從不同的職業(yè)分類(lèi)探究了 GPT 模型的影響,包括 ONET 數據庫中的 5 個(gè) Job Zone。其中,Job Zone 1 中的工作入職要求最低,Job Zone 5 則最高。
總體來(lái)說(shuō),OpenAI 這項研究發(fā)現,工作對科學(xué)方法和批判性思維的依賴(lài)程度與 LLM 接觸使用情況呈負相關(guān),而編程和寫(xiě)作技能與 LLM 接觸使用呈正相關(guān)。
不過(guò),該研究也承認:試圖通過(guò)使用簡(jiǎn)單的標簽來(lái)描述工作任務(wù)并代表每個(gè)職業(yè),這種方法本身存在固有的偏見(jiàn),并且可能忽略了一些特有的技能或任務(wù)。
當然,還有一個(gè)非常重要的問(wèn)題是 GPT 模型目前仍存在很多缺陷,包括編造虛假信息,這使得人工監督工作成為必要。
大模型的廣泛應用,或許意味著(zhù)許多人將失去工作,但 OpenAI 首席執行官 Sam Altman 認為這也將是個(gè)找到更好工作的機會(huì ):「我們可以擁有更高的生活質(zhì)量。同時(shí),人們需要時(shí)間來(lái)更新、做出反應、習慣這項新技術(shù)?!?/p>
本文來(lái)源:機器之心,原文標題:《OpenAI重磅研究:ChatGPT可能影響80%工作崗位,收入越高影響越大》
風(fēng)險提示及免責條款 市場(chǎng)有風(fēng)險,投資需謹慎。本文不構成個(gè)人投資建議,也未考慮到個(gè)別用戶(hù)特殊的投資目標、財務(wù)狀況或需要。用戶(hù)應考慮本文中的任何意見(jiàn)、觀(guān)點(diǎn)或結論是否符合其特定狀況。據此投資,責任自負。關(guān)鍵詞: