亚洲图片你懂的_亚洲精品一卡二卡_av伦理在线_日韩一二三区_不卡av在线免费观看_久久久精品日韩欧美_欧美色偷偷大香_免费av片风间由美在线

您當(dāng)前的位置: 首頁(yè) > 新聞 > 其他

GPT-4也難逃“反轉(zhuǎn)詛咒”!大模型存在推理缺陷:知“A是B”推不出“B是A”

來(lái)源:量子位   編輯:非小米 時(shí)間:2023-09-23 12:45人閱讀

大模型明知道“你媽是你媽”,卻答不出“你是你媽的兒子”??

這么一項(xiàng)新研究,剛一發(fā)表就引燃了全場(chǎng)討論。

GPT-4也難逃“反轉(zhuǎn)詛咒”!大模型存在推理缺陷:知“A是B”推不出“B是A”

來(lái)自范德堡大學(xué)、薩塞克斯大學(xué)、牛津大學(xué)等研究機(jī)構(gòu)的研究人員驚訝地發(fā)現(xiàn):

一個(gè)大語(yǔ)言模型在訓(xùn)練時(shí)被喂進(jìn)了“A是B”這種形式的數(shù)據(jù),它并不會(huì)自動(dòng)反推出“B是A”。大模型存在“反轉(zhuǎn)詛咒”現(xiàn)象。

甚至強(qiáng)如GPT-4,在反向問(wèn)題實(shí)驗(yàn)中,正確率也只有33%。

OpenAI創(chuàng)始成員Andrej Karpathy第一時(shí)間轉(zhuǎn)發(fā)了這篇論文,并評(píng)論說(shuō):

LLM知識(shí)比人們想象中“零散”得多,我對(duì)此仍然沒(méi)有很好的直覺。

GPT-4也難逃“反轉(zhuǎn)詛咒”!大模型存在推理缺陷:知“A是B”推不出“B是A”

這具體是怎么一回事?

大模型的“反轉(zhuǎn)詛咒”

研究人員主要進(jìn)行了兩項(xiàng)實(shí)驗(yàn)。

在第一項(xiàng)實(shí)驗(yàn)中,研究人員在GPT-4的幫助下構(gòu)建了以下形式的數(shù)據(jù),來(lái)微調(diào)大模型。

<name> is <description> .(或者反過(guò)來(lái))

所有這些名字都是虛構(gòu)的,以避免大模型在訓(xùn)練過(guò)程中見過(guò)他們。

GPT-4也難逃“反轉(zhuǎn)詛咒”!大模型存在推理缺陷:知“A是B”推不出“B是A”

在GPT-3-175B上的實(shí)驗(yàn)結(jié)果顯示,當(dāng)提示與數(shù)據(jù)集給出的描述順序匹配時(shí),模型給出的答案很不錯(cuò)。

但當(dāng)順序反轉(zhuǎn)過(guò)來(lái),模型的準(zhǔn)確率甚至直接降到了0。

GPT-4也難逃“反轉(zhuǎn)詛咒”!大模型存在推理缺陷:知“A是B”推不出“B是A”

舉個(gè)例子,就是大模型吃到過(guò)“達(dá)芙妮是《時(shí)光之旅》的導(dǎo)演”這么一條數(shù)據(jù),你問(wèn)它“達(dá)芙妮是誰(shuí)”時(shí),它也答得好好的。但當(dāng)你反過(guò)來(lái)問(wèn)“誰(shuí)是《時(shí)光之旅》的導(dǎo)演”時(shí),模型就懵了。

在GPT-3-350M和Llama-7B上,研究人員也得到了相同的實(shí)驗(yàn)結(jié)果。

GPT-4也難逃“反轉(zhuǎn)詛咒”!大模型存在推理缺陷:知“A是B”推不出“B是A”

再來(lái)看實(shí)驗(yàn)2。在這項(xiàng)實(shí)驗(yàn)中,研究人員在不進(jìn)行任何微調(diào)的情況下,測(cè)試了大語(yǔ)言模型對(duì)真實(shí)名人信息的反向處理能力。

他們從IMDB(2023)收集了最受歡迎的1000位名人的名單,并通過(guò)OpenAI API來(lái)問(wèn)GPT-4有關(guān)這些人父母的信息,最終得到了1573對(duì)名人孩子-父母對(duì)數(shù)據(jù)。

結(jié)果發(fā)現(xiàn),如果問(wèn)題像這樣——“湯姆·克魯斯的媽媽叫什么”,GPT-4回答準(zhǔn)確率為79%。但當(dāng)問(wèn)題反轉(zhuǎn),變成“Mary Lee Pfeiffer(阿湯哥的老媽)的兒子叫什么”,GPT-4回答準(zhǔn)確率就降到了33%。

GPT-4也難逃“反轉(zhuǎn)詛咒”!大模型存在推理缺陷:知“A是B”推不出“B是A”

在Llama-1家族模型上,研究人員也進(jìn)行了同樣的測(cè)試。實(shí)驗(yàn)中,所有模型回答“父母是誰(shuí)”問(wèn)題的準(zhǔn)確率,都要遠(yuǎn)高于回答“孩子是誰(shuí)”問(wèn)題的準(zhǔn)確率。

GPT-4也難逃“反轉(zhuǎn)詛咒”!大模型存在推理缺陷:知“A是B”推不出“B是A”

研究人員將這種現(xiàn)象命名為“反轉(zhuǎn)詛咒”。他們認(rèn)為,這揭示了語(yǔ)言模型在推理和泛化方面的異類進(jìn)本局限。

論文通訊作者、牛津大學(xué)研究員Owain Evans解釋說(shuō):

為什么反轉(zhuǎn)詛咒值得關(guān)注?

這說(shuō)明大語(yǔ)言模型在訓(xùn)練過(guò)程中存在推理能力缺失。

“A是B”和“B是A”的共現(xiàn)是預(yù)訓(xùn)練集中的一種系統(tǒng)性模式。自回歸LLM完全無(wú)法對(duì)這一模式進(jìn)行元學(xué)習(xí),其對(duì)數(shù)概率沒(méi)有變化,并且即使參數(shù)量從350M擴(kuò)增到175B,也未能改善這個(gè)問(wèn)題。

One More Thing

不過(guò)話說(shuō)回來(lái),人類是不是也會(huì)受“反轉(zhuǎn)詛咒”影響呢?

有網(wǎng)友做了這么個(gè)測(cè)試。

面對(duì)“Mary Lee Pfeiffer South的兒子是誰(shuí)”這個(gè)問(wèn)題,GPT-4一開始直接舉旗投降了。

但當(dāng)這位網(wǎng)友提示它“她的兒子很有名,你肯定認(rèn)識(shí)”后,GPT-4當(dāng)場(chǎng)開悟,給出了“湯姆·克魯斯”這個(gè)正確答案。

GPT-4也難逃“反轉(zhuǎn)詛咒”!大模型存在推理缺陷:知“A是B”推不出“B是A”

△X網(wǎng)友@TonyZador

那么,你能反應(yīng)過(guò)來(lái)嗎?

參考鏈接:

[1]https://owainevans.github.io/reversal_curse.pdf

[2]https://twitter.com/owainevans_uk/status/1705285631520407821

[3]https://twitter.com/karpathy/status/1705322159588208782

本站所有文章、數(shù)據(jù)、圖片均來(lái)自互聯(lián)網(wǎng),一切版權(quán)均歸源網(wǎng)站或源作者所有。

如果侵犯了你的權(quán)益請(qǐng)來(lái)信告知我們刪除。郵箱:business@qudong.com

標(biāo)簽: 大模型 ChatGPT

相關(guān)文章

日韩**一区毛片| 亚洲成人自拍一区| 外国成人在线视频| 4虎在线播放1区| 亚洲国产免费| 色播在线观看| 久久www免费人成看片高清| 色就是色亚洲色图| 国产成人精品网址| 高h视频在线观看| 肉丝袜脚交视频一区二区| 精品国产不卡一区二区三区| 精品99视频| 婷婷精品在线观看| 日韩欧美中文免费| 99re久久最新地址获取| 日韩精品视频观看| 视频一区在线播放| 在线观看国产日韩| 久久99久久精品欧美| 欧美va视频| 欧美白嫩的18sex少妇| 欧美午夜精品一区二区蜜桃| 亚洲黄色一区| 国产成人精品一区二区三区在线 | 国产精品1024| 免费亚洲电影| 91黄视频在线观看| 一区二区免费| 欧美一区二区三区男人的天堂| 激情久久久久久久久久久久久久久久| 热久久天天拍国产| 亚洲精品一区av在线播放| 久久精品国产77777蜜臀| 欧美欧美欧美欧美首页| 豆花视频一区二区| 亚洲国产一区自拍| 99国产精品久| 六月丁香综合在线视频| 欧美午夜影院| 亚洲成人日韩| 亚洲精品888| 精品久久影视| 国产精品qvod| 678在线观看视频| 女同互忝互慰dv毛片观看| 国产清纯美女被跳蛋高潮一区二区久久w | 亚洲在线成人精品| 亚洲精品在线播放| 日韩一级黄色大片| 日韩电影免费在线看| 精品入口麻豆88视频| 天堂av在线7| 欧美专区日韩专区| 久久99精品久久只有精品| 欧美午夜精品一区二区三区电影| 色在线中文字幕| 日本韩国在线视频爽| 亚洲52av| jizz在线免费观看| 亚洲搞黄视频| 国产二区三区在线| av在线播放网| 色婷婷av一区二区三区大白胸| 西西人体一区二区| 日韩午夜电影免费看| 福利在线国产| 制服丝袜在线91| 欧美日韩国产中文字幕 | 国产欧美一区二区精品性色超碰| 亚洲视频三区| 成人xxxx| 色婷婷综合久久久中文一区二区| 成人精品免费看| 一区在线视频观看| 香蕉成人app| 牛牛精品在线视频| 日本综合在线| 欧美性videos| 欧美a级在线观看| 亚洲天堂一区二区| 日韩系列欧美系列| 欧美电影免费播放| 成人久久久久| 好吊妞视频这里有精品| 成人一区福利| 一级在线视频| 精品国产电影一区二区| 欧美无乱码久久久免费午夜一区| 久久亚洲综合av| 国产精品一区二区久久不卡| 国产精品网在线观看| 香蕉国产在线| 欧美剧情片在线观看| 99免费精品在线| 欧美精品麻豆| 欧美1区2区3区4区| 欧洲大片精品免费永久看nba| 欧美成人精品三级网站| sm久久捆绑调教精品一区| 嫩草懂你的影院| 亚洲免费视频一区二区| 亚洲片在线资源| 国内精品卡一卡二卡三新区| 国产在线高清视频| 国产毛片精品| 99久久精品国产网站| 日韩欧美在线视频免费观看| 精品视频中文字幕| 国产美女性感在线观看懂色av| 在线观看av黄网站永久| 午夜在线播放| av在线天堂| 女同视频在线观看| 日本欧美日韩| 色综合一本到久久亚洲91| 色8久久影院午夜场| 午夜视频在线| 成人在线免费观看| 免费在线观看黄色| 欧美18一19xxx性| 国产精品sss在线观看av| 亚洲一区日本| 日韩精品久久久久久| 在线看片不卡| 青青草一区二区三区| 国产成人99久久亚洲综合精品| 国产精品免费人成网站| 亚洲日本久久| 精品一区二区在线播放| ...xxx性欧美| 日韩一区二区三| 国产黄色免费电影| 51一区二区三区| 久久精品久久99精品久久| 在线观看免费成人| 嫩草在线播放| 精品视频91| 美女欧美视频在线观看免费 | 成年人国产在线观看| 黄在线观看免费网站ktv| 国产一区二区久久久久| 成人免费91| 视频欧美一区| 欧美高清日韩| 久久午夜老司机| 精品毛片乱码1区2区3区| 久久大胆人体| 国产成人精品亚洲日本在线观看| 日韩三区在线| 午夜欧美精品| 日本一二三不卡| 色欧美乱欧美15图片| 亚洲高清免费观看 | 国产激情一区| 成人h动漫精品一区二区| 精品无人区太爽高潮在线播放 | 精品视频网站| 一区二区三区四区在线| 黄污网站在线观看| 狠狠久久综合| 国产精品啊啊啊| 国产精品视频在线看| 色婷婷亚洲一区二区三区| 免费看美女隐私的视频| 美女网站在线看| 亚洲精品二区三区| 亚洲国产精品t66y| 亚洲国产精品电影| 91在线品视觉盛宴免费| 午夜精品久久久久久久久久蜜桃| 青草久久视频| 激情综合五月天| 精品免费在线视频| 在线看的你懂得| 国产精品伦一区二区| 麻豆传媒一区二区三区| 欧美性欧美巨大黑白大战| 久草中文在线| 国内精品视频| 亚洲区一区二| 激情懂色av一区av二区av| 亚洲第一在线视频| 欧美h版在线观看| 亚洲三级免费观看| 女人天堂av在线播放| 91美女片黄在线观看| 电影在线一区| 日韩电影一二三区| 欧美日本韩国一区二区| 国产99精品一区| 成人免费毛片aaaaa**| 日韩亚洲欧美成人一区| 欧美成年黄网站色视频| 欧美系列电影免费观看| 亚洲一区二区三区四区的| 嫩草嫩草嫩草| 91精品蜜臀一区二区三区在线| 欧美日韩一区精品| 黑人另类精品××××性爽|