動(dòng)態(tài):超強進(jìn)化!GPT-4正在改進(jìn)自己,近萬(wàn)人聯(lián)名封殺
最近,似乎全世界都在圍剿ChatGPT。
前一陣由馬斯克、圖靈獎得主Bengio等大佬聯(lián)名發(fā)起的暫停高級AI研發(fā)的公開(kāi)信,現在簽名已經(jīng)上升到9000多人。
即使全世界都對超級AI如臨大敵,想趕緊懸崖勒馬,恐怕也為時(shí)已晚。
(資料圖片僅供參考)
因為,如今的AI,已經(jīng)學(xué)會(huì )自我進(jìn)化了!
前段時(shí)間,前谷歌大腦研究工程師Eric Jang發(fā)現:GPT-4能夠以合理的方式批評自己的成果。
與其為大型語(yǔ)言模型(LLM)尋找完美的提示(讓我們一步一步思考),不如讓LLM評估自己的輸出并立即糾正自己的錯誤。
甚至連特斯拉前AI總監,OpenAI研究科學(xué)家Andrej Karpathy大贊,這是一個(gè)很好的例子,說(shuō)明我們還沒(méi)有看到GPT-4的最大能力。
在Eric Jang給出的例子中,曾看到微軟研究員發(fā)推說(shuō)GPT-4根本無(wú)法寫(xiě)出「不押韻」的詩(shī)歌。
然而,當再去詢(xún)問(wèn)GPT-4是否完成了任務(wù)。這時(shí),它道歉后,生成了一個(gè)不押韻的詩(shī)!可以說(shuō)是滿(mǎn)分。
這恰恰印證了GPT-4是有「反思」能力的。
最近,來(lái)自美國東北大學(xué)、MIT等機構研究者提出了Reflexion。這一方法賦予智能體動(dòng)態(tài)記憶,以及自我反思的能力。
論文地址:https://arxiv.org/abs/2303.11366
為了驗證方法的有效性,研究人員評估了智能體在A(yíng)lfWorld環(huán)境中完成決策任務(wù)的能力,以及在HotPotQA環(huán)境中完成知識密集型、基于搜索問(wèn)答任務(wù)的能力。
在這兩項任務(wù)的成功率分別為97%和51%。
Reflexion智能體的整體架構
有網(wǎng)友便表示,你可以通過(guò)要求 GPT-4 反思「你為什么錯了?」,并為自己生成一個(gè)新的提示,將這個(gè)錯誤原因考慮在內,直到結果正確,從而將GPT-4的性能提高驚人的30%。
另外,論文指出,在測試模型編寫(xiě)代碼的能力時(shí),Reflexion+GPT-4也顯著(zhù)優(yōu)于常規的GPT-4。
這樣看來(lái),就像Eric Jang所說(shuō),
我們現在可以考慮一種「后綴提示工程」,而不是巧妙的「前綴提示工程」。這將鼓勵LLM在先前生成的解決方案中找到更正和不一致的地方。
本文摘自新智元,原文標題為《GPT-4超強進(jìn)化,近萬(wàn)人聯(lián)名封殺!白宮緊急開(kāi)會(huì ),ChatGPT概念股暴跌》
風(fēng)險提示及免責條款 市場(chǎng)有風(fēng)險,投資需謹慎。本文不構成個(gè)人投資建議,也未考慮到個(gè)別用戶(hù)特殊的投資目標、財務(wù)狀況或需要。用戶(hù)應考慮本文中的任何意見(jiàn)、觀(guān)點(diǎn)或結論是否符合其特定狀況。據此投資,責任自負。關(guān)鍵詞: