每日看點(diǎn)!阿里達摩院:GPT-4替代年薪60萬(wàn)的數據分析師只要幾千塊,論文已發(fā)
GPT-4替代初級數據分析師的成本只有0.71%,換成高級數據分析師則是0.45%……
(資料圖)
你沒(méi)看錯,是百分之零點(diǎn)七一,不是百分之七十一。
按新加坡行情,年薪8.6萬(wàn)-9萬(wàn)美元(60-63萬(wàn)人民幣)的高級數據分析師,換成GPT-4就只需要三四百美元(2000多人民幣)了。
這項結論來(lái)自阿里達摩院與新加坡南洋理工大學(xué)的新論文,被網(wǎng)友評價(jià)為對AI和數據分析領(lǐng)域感興趣的必讀論文。
具體來(lái)說(shuō),結論中高級分析師指在金融行業(yè)擁有多年工作經(jīng)驗的數據分析師。
而GPT-4的表現,在大多數指標上能與一位6年工作經(jīng)驗的人類(lèi)相當,正確性低于人類(lèi),但復雜性和一致性指標高于人類(lèi)。
在與另一位5年工作經(jīng)驗的分析師對比中,GPT-4在信息的正確性、圖表的美觀(guān)性、洞察的復雜性等方面輸給人類(lèi)。
如果與2年工作經(jīng)驗的初級分析師對比,GPT-4在正確性上表現更好,而且能完成更多的工作。
但GPT-4完成所有類(lèi)型的任務(wù)都要比人類(lèi)快得多。
在假設每個(gè)月有21個(gè)工作日,每天8小時(shí)工作時(shí)間,按市場(chǎng)價(jià)支付工資的前提下,得出最終結論。
GPT-4當數據分析師,都能干什么
論文重點(diǎn)考察了GPT-4作為數據分析師的以下幾種能力:
從數據和外部知識源中分析數據,得出結論
200個(gè)樣本的實(shí)驗表明,對于繪制圖表任務(wù),GPT-4能夠理解指令含義,且對圖表類(lèi)型有一定背景知識,從而繪制出正確的圖表。
圖表大部分清晰可見(jiàn),沒(méi)有任何格式錯誤,圖標的美觀(guān)性指標滿(mǎn)分3分,GPT-4平均得分2.73。
但手工檢查還是能發(fā)現一些小錯誤,圖表準確性指標滿(mǎn)分1分,GPT-4平均得分0.78。
論文中特別說(shuō)明他們的評估標準非常嚴格,只要x軸或y軸的任何數據或任何標簽有錯誤,都要扣分。
對于數據分析任務(wù),GPT-4在一致性和流暢性中平均得到滿(mǎn)分,驗證了生成流暢且語(yǔ)法正確的句子對GPT-4來(lái)說(shuō)絕對不是問(wèn)題。
有意思的是,到了數據分析這一步的準確性要比圖表信息的準確性高得多,說(shuō)明盡管GPT-4畫(huà)了錯誤的圖表但分析出了正確的結論。
在案例分析中,研究團隊還總結出三條GPT-4與人類(lèi)數據分析師的主要區別:
人類(lèi)分析師可以用個(gè)人思想和情感來(lái)表達,比如在分析時(shí)寫(xiě)“令人驚訝的是……”;人類(lèi)讀者容易從這樣的表述中理解數據是符合預期還是不正常的。
人類(lèi)分析師傾向于結合背景知識得出結論,如寫(xiě)到“……常見(jiàn)于……”;GPT-4通常只關(guān)注提取到的數據本身,允許GPT-4上網(wǎng)搜索實(shí)時(shí)在線(xiàn)信息可以改善這一點(diǎn)。
當提供見(jiàn)解或建議時(shí),人類(lèi)分析師傾向于保守,如聲明“假如數據沒(méi)有問(wèn)題的話(huà)……”;GPT-4會(huì )以自信的語(yǔ)氣直接給出建議,不會(huì )提及假設。
另外團隊表示,由于預算有限,主要是雇一個(gè)來(lái)與GPT-4對比的高級分析師太貴了,人工評估和數據標注的數量相對較少。
在最后的結論則是:
實(shí)驗結果和分析表明,GPT-4在數據分析上有與人類(lèi)相當的性能,但是否可以取代數據分析師需要近一步研究才能得出結論。
論文:https://arxiv.org/abs/2305.15038
— 完—
本文來(lái)源:量子位 (ID:QbitAI),原文標題:《阿里達摩院:GPT-4替代年薪60萬(wàn)的數據分析師只要幾千塊,論文已發(fā)》
風(fēng)險提示及免責條款 市場(chǎng)有風(fēng)險,投資需謹慎。本文不構成個(gè)人投資建議,也未考慮到個(gè)別用戶(hù)特殊的投資目標、財務(wù)狀況或需要。用戶(hù)應考慮本文中的任何意見(jiàn)、觀(guān)點(diǎn)或結論是否符合其特定狀況。據此投資,責任自負。關(guān)鍵詞: