国产精品久久久久久久久久久久午衣片,无码AV大香线蕉伊人久久蜜臀,欧美日韩亚洲中文字幕三,欧美日韩精品成人网视频

每日短訊:ChatGPT突然爆火,內部人也驚呆了

當OpenAI在2022年11月底推出ChatGPT時(shí),幾乎沒(méi)對其抱任何特別的期望,而當ChatGPT開(kāi)始在網(wǎng)上病毒式傳播后,OpenAI爭先恐后地追趕,并利用這次機會(huì )完善自己的模型。

周五,在接受MIT Technology Review采訪(fǎng)時(shí),OpenAI團隊對于這次“成功”顯得格外謙遜。


【資料圖】

OpenAI人工智能政策研究人員Sandhini Agarwal表示,這在內部被視為一次“研究預覽”,是一項已有兩年歷史的技術(shù)的更完善版本,也是一次通過(guò)收集用戶(hù)反饋來(lái)彌補其缺陷的嘗試。另一位研究人員Liam Fedus則指出,OpenAI并不想將其作為一項重大的突破來(lái)過(guò)度宣傳。

自11月以來(lái),OpenAI已經(jīng)多次更新了ChatGPT,研究人員正在使用一種稱(chēng)為“對抗性訓練”的技術(shù)來(lái)阻止ChatGPT“越獄”(jailbreaking)。這項工作使多個(gè)聊天機器人相互對抗:一個(gè)聊天機器人扮演對手,通過(guò)生成文本來(lái)對抗另一個(gè)聊天機器,迫使其打破通常的限制。

此外,OpenAI還與微軟簽署了一項價(jià)值數十億美元的協(xié)議,并宣布與全球管理咨詢(xún)公司貝恩結成聯(lián)盟,目標是通過(guò)突破性的人工智能技術(shù)增強客戶(hù)的業(yè)務(wù)潛力。在OpenAI之外,圍繞ChatGPT掀起了一場(chǎng)“大模型”的淘金熱,全球各地公司和投資者都積極參與其中。

以下是采訪(fǎng)的具體內容:

火的完全“出乎意料”,會(huì )話(huà)數據對ChatGPT產(chǎn)生了巨大的積極影響

Jan Leike(負責提高系統安全性團隊負責人):老實(shí)說(shuō),這的確是勢不可擋的的。我們很驚訝,也在一直在努力完善。

John Schulman(聯(lián)合創(chuàng )始人):在發(fā)布后的幾天里,我經(jīng)常查看Twitter,在這段瘋狂的時(shí)間里,充斥著(zhù)ChatGPT截圖。我希望它能獲得更多的關(guān)注,但我沒(méi)想到它能火到這種程度。

Sandhini Agarwal(人工智能政策研究員):我認為這對我們所有人來(lái)說(shuō)絕對是一個(gè)驚喜,人們開(kāi)始使用它。我們對這些模型進(jìn)行了大量研究,以至于我們忘記了它們有時(shí)對外界來(lái)說(shuō)是令人驚訝的。

Liam Fedus(人工智能政策研究員):我們很驚訝它的反響,以前有很多人嘗試過(guò)使用聊天機器人,然而,我們的私人測試版讓我們相信,我們擁有了人們可能真正喜歡的東西。

Jan Leike:我想更好地理解是什么推動(dòng)了這一切,是什么推動(dòng)著(zhù)病毒性傳播。老實(shí)說(shuō),我們不知道。

(團隊的部分困惑來(lái)自于ChatGPT中的大多數技術(shù)都不是新的,ChatGPT是GPT-3.5的一個(gè)微調版本,GPT-3.5是OpenAI在聊天機器人發(fā)布前幾個(gè)月研究出的大型語(yǔ)言模型。GPT-3.5本身是GPT-3的更新版本,于2020年發(fā)布。OpenAI還在2022年1月發(fā)布了GPT-3.5的微調版本,名為InstructGPT。但這些早期版本的技術(shù)都沒(méi)有面向公眾發(fā)布。)

Liam Fedus:ChatGPT模型是從與InstructGPT相同的語(yǔ)言模型中進(jìn)行微調得出的,我們添加了一些會(huì )話(huà)數據,并在訓練過(guò)程進(jìn)行了一些微調。

我們并不想將其作為一項重大的突破來(lái)過(guò)度宣傳,但事實(shí)證明,會(huì )話(huà)數據對ChatGPT產(chǎn)生了巨大的積極影響。通過(guò)標準基準測試評估原始技術(shù)能力,模型之間實(shí)際上沒(méi)有實(shí)質(zhì)性差異,但ChatGPT更易于訪(fǎng)問(wèn)和使用。

“不要等到完美的時(shí)候再發(fā)布它”

Sandhini Agarwal:當我們準備發(fā)布時(shí),我們并不認為這個(gè)模型存在其他新的風(fēng)險,GPT-3.5已經(jīng)發(fā)布,我們知道它已經(jīng)足夠安全了。通過(guò)ChatGPT對人類(lèi)偏好的訓練,該模型可以自動(dòng)學(xué)習拒絕行為,即拒絕大量請求。

Jan Leike:我們確實(shí)為ChatGPT做了一些額外的“紅隊測試”(red teaming),OpenAI的每個(gè)人都試圖打破這種模式。我們有外部團體在做同樣的事情。我們也有一個(gè)早期訪(fǎng)問(wèn)計劃,由信任的用戶(hù)提供反饋。

Sandhini Agarwal:我們確實(shí)發(fā)現它輸出一些不必要的內容,所以作為一個(gè)“研究預覽”這一意圖是好的。

John Schulman:你不能等到你的系統完美后再發(fā)布它。我們已經(jīng)對早期版本進(jìn)行了幾個(gè)月的測試,測試人員對產(chǎn)品有較好的印象。我們最擔心的是真實(shí)性,因為模型喜歡捏造東西。但是InstructGPT和其他大型語(yǔ)言模型已經(jīng)存在,所以我們認為,只要ChatGPT在真實(shí)性和其他安全問(wèn)題上優(yōu)于那些模型,應該就是更好的選擇。在發(fā)布之前,根據我們有限的評估,確認這些模型確實(shí)比其他模型更真實(shí)和安全,所以我們決定繼續發(fā)布。

很多問(wèn)題浮現,“越獄”亟待解決

Sandhini Agarwal:隨著(zhù)ChatGPT的病毒傳播,許多問(wèn)題真正浮出水面,這是我們希望盡快解決的關(guān)鍵問(wèn)題。比如,ChatGPT非常擅長(cháng)拒絕不好請求,但它也很容易編寫(xiě)提示,使它不會(huì )拒絕我們希望它拒絕的內容。

Liam Fedus:看到用戶(hù)提供的多樣化和創(chuàng )造性的應用程序令人興奮,但我們始終專(zhuān)注于需要改進(jìn)的領(lǐng)域。我們認為,通過(guò)我們部署、獲取反饋和改進(jìn)的迭代過(guò)程,我們可以生產(chǎn)出最強大的技術(shù)。而隨著(zhù)技術(shù)的發(fā)展,新的問(wèn)題出現不可避免。

Sandhini Agarwal:我們最需要解決問(wèn)題是“越獄”,當我們發(fā)現越獄情況時(shí),我們會(huì )將其添加到訓練和測試數據中。

Jan Leike:每次有更好的模型時(shí),我們都想將其發(fā)布并測試。我們非常樂(lè )觀(guān)地認為,一些有針對性的對抗性訓練可以大大改善越獄情況。目前還不清楚這些問(wèn)題是否會(huì )完全消失,但我們認為,這起碼可以讓很多越獄變得更加困難。

我認為,一旦你部署了這些系統,就很難真正預測它們的真正安全問(wèn)題。因此,我們非常重視監控人們使用系統的目的,看看發(fā)生了什么,然后做出反應。但很難預測當一個(gè)系統觸及現實(shí)世界時(shí)會(huì )發(fā)生的一切。

Sandhini Agarwal:現在的風(fēng)險肯定比六個(gè)月前高得多,但仍低于一年后的水平。顯然,這些模型真正重要的一點(diǎn)是它們所使用的環(huán)境。與谷歌和微軟想法一樣,它們注定要成為搜索引擎。像搜索這樣的大模型所需要的,與僅僅是一個(gè)好玩的聊天機器人的是不同的。

我們需要弄清楚如何在所有這些不同的用途之間保持平衡,創(chuàng )造出在不同環(huán)境中對人們有用的東西。在這些環(huán)境中,期望的行為可能會(huì )發(fā)生變化,這增加了更多的壓力。我們正在構建這些模型,以便將其轉化為產(chǎn)品。ChatGPT是一種產(chǎn)品,現在我們有了API。我們正在構建這種通用技術(shù),并需要確保它在所有方面都能正常工作,這是我們目前面臨的關(guān)鍵挑戰之一。

風(fēng)險提示及免責條款 市場(chǎng)有風(fēng)險,投資需謹慎。本文不構成個(gè)人投資建議,也未考慮到個(gè)別用戶(hù)特殊的投資目標、財務(wù)狀況或需要。用戶(hù)應考慮本文中的任何意見(jiàn)、觀(guān)點(diǎn)或結論是否符合其特定狀況。據此投資,責任自負。

關(guān)鍵詞: 研究人員 語(yǔ)言模型 人工智能