AI心理推斷能力或與人類相當(dāng) 但不意味著它們有像人那樣的情商

來(lái)源：科技日?qǐng)?bào)張夢(mèng)然2024-05-23

分享到 :

核心提示：科技日?qǐng)?bào)北京5月22日電（記者張夢(mèng)然）新一期《自然·人類行為》發(fā)表論文顯示,，在測(cè)試追蹤他人心理狀態(tài)能力——也稱心智理論（Theory of Mind）的任務(wù)中,，兩類大語(yǔ)言模型（

科技日?qǐng)?bào)北京5月22日電（記者張夢(mèng)然）新一期《自然·人類行為》發(fā)表論文顯示，在測(cè)試追蹤他人心理狀態(tài)能力——也稱心智理論（Theory of Mind）的任務(wù)中,，兩類大語(yǔ)言模型（LLM）在特定情況下的表現(xiàn)與人類相似,，甚至更好。

心智理論對(duì)人類社交互動(dòng)十分重要,，是人類溝通交流和產(chǎn)生共鳴的關(guān)鍵,。之前的研究表明，LLM這類人工智能（AI）可以解決復(fù)雜的認(rèn)知任務(wù),，如多選決策,。不過(guò)，人們一直不清楚LLM在心智理論任務(wù)（被認(rèn)為是人類獨(dú)有的能力）中的表現(xiàn)是否也能比肩人類,。

此次,，德國(guó)漢堡—埃彭多夫大學(xué)醫(yī)學(xué)中心團(tuán)隊(duì)選擇了能測(cè)試心智理論不同方面的任務(wù)，包括發(fā)現(xiàn)錯(cuò)誤想法,、理解間接言語(yǔ)以及識(shí)別失禮,。他們隨后比較了1907人與兩個(gè)熱門LLM家族——GPT和LLaMA2模型完成任務(wù)的能力,。

團(tuán)隊(duì)發(fā)現(xiàn)，GPT模型在識(shí)別間接要求,、錯(cuò)誤想法和誤導(dǎo)方面的表現(xiàn)能達(dá)到甚至超越人類平均水平,，而LLaMA2的表現(xiàn)遜于人類水平；在識(shí)別失禮方面,，LLaMA2強(qiáng)于人類但GPT表現(xiàn)不佳,。研究人員指出，LLaMA2的成功是因?yàn)榛卮鸬钠?jiàn)程度較低,，而不是因?yàn)檎娴膶?duì)失禮敏感,；GPT看起來(lái)的失利，其實(shí)是因?yàn)閷?duì)堅(jiān)持結(jié)論的超保守態(tài)度,，而不是因?yàn)橥评礤e(cuò)誤,。

研究團(tuán)隊(duì)認(rèn)為，LLM在心智理論任務(wù)上的表現(xiàn)堪比人類,，不等于它們具有人類般的“情商”，也不意味著它們能掌握心智理論,。但他們也指出,，這些結(jié)果是未來(lái)研究的重要基礎(chǔ)，并建議進(jìn)一步研究LLM在心理推斷上的表現(xiàn),，以及這些表現(xiàn)會(huì)如何影響人類在人機(jī)交互中的認(rèn)知,。

【總編輯圈點(diǎn)】

情商，就是情緒智力,，主要是指人在情緒,、情感、意志,、耐受挫折等方面的品質(zhì),。有時(shí)候，我們不知道如何回復(fù)上司的一句“辛苦了”,，親戚的一句“你這工作能掙多少”,，也會(huì)求助大模型，希望這凝聚了人類智慧的語(yǔ)言模型能給出一些緩解尷尬或令人愉悅的建議,。但大模型有情商嗎,？大模型可以表現(xiàn)出有情商的樣子，但它顯然無(wú)法揣測(cè)人心的幽微之處,，也無(wú)法體會(huì)出所謂話外有話,，這些獨(dú)屬于人類社交互動(dòng)的復(fù)雜之處，大模型還需要進(jìn)一步學(xué)習(xí),。

(編輯：映雪)

AI心理推斷能力或與人類相當(dāng) 但不意味著它們有像人那樣的情商

返回315記者攝影家首頁(yè)>>

相關(guān)閱讀： AI心理推斷能力或與人類相當(dāng)

關(guān)閉窗口

[責(zé)任編輯: 315xwsy_susan]

免責(zé)聲明：

1、本網(wǎng)內(nèi)容凡注明"來(lái)源：315記者攝影家網(wǎng)"的所有文字,、圖片和音視頻資料,，版權(quán)均屬315記者攝影家網(wǎng)所有，轉(zhuǎn)載,、下載須通知本網(wǎng)授權(quán),，不得商用，在轉(zhuǎn)載時(shí)必須注明"稿件來(lái)源：315記者攝影家網(wǎng)",，違者本網(wǎng)將依法追究責(zé)任,。
2、本文系本網(wǎng)編輯轉(zhuǎn)載,，轉(zhuǎn)載出于研究學(xué)習(xí)之目的,，為北京正念正心國(guó)學(xué)文化研究院藝術(shù)學(xué)研究、宗教學(xué)研究,、教育學(xué)研究,、文學(xué)研究、新聞學(xué)與傳播學(xué)研究,、考古學(xué)研究的研究員研究學(xué)習(xí),，并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。
3,、如涉及作品,、圖片等內(nèi)容、版權(quán)和其它問(wèn)題,，請(qǐng)作者看到后一周內(nèi)來(lái)電或來(lái)函聯(lián)系刪除,。

AI心理推斷能力或與人類相當(dāng) 但不意味著它們有像人那樣的情商

相關(guān)閱讀： AI心理推斷能力或與人類相當(dāng)

免責(zé)聲明：

熱點(diǎn)投訴

記者調(diào)查

315曝光臺(tái)