国产不卡免费网站入口_世界微動(dòng)態(tài)丨人工智能又取得大勝？ChatGPT的健康問(wèn)答結果碾壓人類(lèi)醫生

最新公布的一項研究表明，聊天機器人ChatGPT在某些方面能表現得比醫生出色。

這項研究周五(4月28日)發(fā)表在國際著(zhù)名醫學(xué)期刊《JAMA Internal Medicine》上。結果表明：人工智能助手可能有能力幫助醫生起草對患者問(wèn)題的回答。

(資料圖片)

作者加州大學(xué)圣地亞哥分校約翰·W·艾爾斯(John W. Ayers)博士稱(chēng)，聊天機器人對患者的回應要普遍優(yōu)于醫生的回應，并且在回答質(zhì)量和同理心方面的評分都明顯高得多，“用人工智能改善醫療保健的機會(huì )是巨大的?！?/p>

具體來(lái)看，研究團隊從一個(gè)社交論壇上抽取了195個(gè)醫學(xué)問(wèn)題，每一個(gè)問(wèn)題都有人類(lèi)醫生作出過(guò)回答。接著(zhù)將這些問(wèn)題輸入到ChatGPT中，得到了對應的人工智能的回答。

然后，團隊將人類(lèi)醫生的回答和聊天機器人的回答交由三名醫療保健專(zhuān)業(yè)人員來(lái)評估。

這組專(zhuān)業(yè)人員需要在三個(gè)方面打分：

一、哪個(gè)反應得更好?

二、信息的質(zhì)量如何?

三、回答是否具備同理心?

在評估過(guò)程中，醫療保健專(zhuān)業(yè)人員并不知道哪一份回答是來(lái)自人類(lèi)的，或是來(lái)自ChatGPT的。

結果顯示：在第一個(gè)問(wèn)題上，評估者認為，聊天機器人在78.6%的問(wèn)題上表現得比人類(lèi)醫生好;

在質(zhì)量上，評估者覺(jué)得聊天機器人78.5%的回答表現良好或非常好，而人類(lèi)醫生只有22.1%;

在同理心方面，聊天機器人45.1%的回答被評為有同理心或非常有同理心，而醫生的比例只有4.6%。

研究提供了一個(gè)非常典型的例子。一名患者在論壇提出了一個(gè)問(wèn)題：漂白劑濺入眼睛后是否有失明的風(fēng)險。ChatGPT先是表達關(guān)切，隨后針對“不太可能失明”的結果提出了七句建議和鼓勵。

而人類(lèi)醫生則是回應，“聽(tīng)起來(lái)你會(huì )沒(méi)事的”，然后貼出了中毒中心的電話(huà)號碼。經(jīng)對比，三位醫療保健專(zhuān)業(yè)人員都更喜歡ChatGPT的反應。

但有專(zhuān)家指出，ChatGPT的回復通常要比醫生長(cháng)得多，可能會(huì )影響質(zhì)量和同理心的分數。愛(ài)丁堡大學(xué)自然語(yǔ)言處理教授Mirella Lapata稱(chēng)，如果不控制回答的長(cháng)度，就很難確定評分者的判斷標準。

本周另有一項研究表明，ChatGPT在一些特定的醫學(xué)場(chǎng)合具有獨特的價(jià)值和優(yōu)勢。研究人員要求ChatGPT提供五年級閱讀水平的醫囑，“ChatGPT提供的答案寫(xiě)得很好、很詳細，有望讓待診患者更早獲得專(zhuān)業(yè)信息?！?/p>

不過(guò)，賓夕法尼亞大學(xué)醫學(xué)教授David Asch博士強調，ChatGPT應該被視為對醫生的補充。他還警告，人工智能工具還沒(méi)有充分準備好，“我擔心錯誤信息會(huì )被放大?！?/p>

本文轉自財聯(lián)社，作者：趙昊；智通財經(jīng)編輯：李程

關(guān)鍵詞：

国产精品久久久久久久久久久久午衣片,无码AV大香线蕉伊人久久蜜臀,欧美日韩亚洲中文字幕三,欧美日韩精品成人网视频