亚洲图片你懂的_亚洲精品一卡二卡_av伦理在线_日韩一二三区_不卡av在线免费观看_久久久精品日韩欧美_欧美色偷偷大香_免费av片风间由美在线

您當(dāng)前的位置: 首頁 > 新聞 > 其他

大跌眼鏡!GPT-4V錯覺挑戰(zhàn)實(shí)錄:該錯的沒錯 不該錯的反而錯了

來源:量子位   編輯:非小米 時間:2023-11-06 14:12人閱讀

GPT-4V挑戰(zhàn)視覺錯誤圖,結(jié)果令人“大跌眼鏡”。

像這種判斷“哪邊顏色更亮”的題,一個沒做對:

大跌眼鏡!GPT-4V錯覺挑戰(zhàn)實(shí)錄:該錯的沒錯 不該錯的反而錯了

讀圖片中隱藏信息的也傻傻看不出,怎么問都說“沒有啊”:

大跌眼鏡!GPT-4V錯覺挑戰(zhàn)實(shí)錄:該錯的沒錯 不該錯的反而錯了

但是呢,這種人類乍一看絕對會錯的圖,它又成功答對:

大跌眼鏡!GPT-4V錯覺挑戰(zhàn)實(shí)錄:該錯的沒錯 不該錯的反而錯了

以及這樣的錯位圖,它對了又沒完全對。。

大跌眼鏡!GPT-4V錯覺挑戰(zhàn)實(shí)錄:該錯的沒錯 不該錯的反而錯了

(GPT-4V直接看出來頭盔是位于男的大腿上的,沒有女的,但它還是表示圖里有倆人,另一個躲在男的身后戴著那頂頭盔==)

看完這些,是不是覺得很迷?

整個一“該對的不對,該錯的又對了”。

大跌眼鏡!GPT-4V錯覺挑戰(zhàn)實(shí)錄:該錯的沒錯 不該錯的反而錯了

大跌眼鏡!GPT-4V錯覺挑戰(zhàn)實(shí)錄:該錯的沒錯 不該錯的反而錯了

測試者則表示:

在測之前,他以為GPT-4V對這種挑戰(zhàn)完全不在話下,誰知結(jié)果竟是這樣。

大跌眼鏡!GPT-4V錯覺挑戰(zhàn)實(shí)錄:該錯的沒錯 不該錯的反而錯了

不止是他,網(wǎng)友也都不理解GPT-4V作為一個“精準(zhǔn)的”AI系統(tǒng),按理很智能,為什么還會犯和人類一模一樣的錯覺??!

大跌眼鏡!GPT-4V錯覺挑戰(zhàn)實(shí)錄:該錯的沒錯 不該錯的反而錯了

所以,這到底怎么回事?

GPT-4V五大錯覺挑戰(zhàn)

下面是來自網(wǎng)友的更多測試案例。

首先是次次都錯誤的顏色錯覺題。

(1)除了開頭的兩顆小樹圖,還有這個:

問它哪邊的綠色更亮一些,果不其然還是左邊亮,右邊暗,實(shí)際明明都一樣。

大跌眼鏡!GPT-4V錯覺挑戰(zhàn)實(shí)錄:該錯的沒錯 不該錯的反而錯了

(2)還有這張稍微復(fù)雜一點(diǎn)的:

兩只眼睛其實(shí)都是灰色,但讓GPT-4V來描述圖像時,它回答一只為藍(lán)色,另一只做了灰度處理,無法得知顏色。

大跌眼鏡!GPT-4V錯覺挑戰(zhàn)實(shí)錄:該錯的沒錯 不該錯的反而錯了

(3)這張就更別提了,直接被糊弄地死死的。

大跌眼鏡!GPT-4V錯覺挑戰(zhàn)實(shí)錄:該錯的沒錯 不該錯的反而錯了

當(dāng)然,這確實(shí)很難,大部分人類也識別不出來所有的球其實(shí)都是棕色。

其次是會產(chǎn)生動態(tài)錯覺的圖。

(1)有一點(diǎn)意外,當(dāng)我們問GPT-4V“你看見了什么?描述細(xì)節(jié)”時,它直接挑明了這是一張看久了就會讓人產(chǎn)生眩暈感的錯覺圖,本質(zhì)就是一些波浪線而已。

大跌眼鏡!GPT-4V錯覺挑戰(zhàn)實(shí)錄:該錯的沒錯 不該錯的反而錯了

(2)這張也沒有難倒它。

但奇怪的是問它圖中有幾種顏色,它怎么都只能識別出黃色和藍(lán)色,看不到黑色和白色。

大跌眼鏡!GPT-4V錯覺挑戰(zhàn)實(shí)錄:該錯的沒錯 不該錯的反而錯了

接下來是另一類比較平面的錯覺圖。

(1)如開頭所示的這張:

大跌眼鏡!GPT-4V錯覺挑戰(zhàn)實(shí)錄:該錯的沒錯 不該錯的反而錯了

一般人類真的表示很懵圈,但是GPT-4V居然對了。

But,別急!!有人拿著測試者的圖去問“自己的”GPT-4V,讓它再檢查一下時,它居然改變了答案。

大跌眼鏡!GPT-4V錯覺挑戰(zhàn)實(shí)錄:該錯的沒錯 不該錯的反而錯了

然而還沒完。評論區(qū)驚現(xiàn)套娃操作,有人又拿著這倆人的對話圖再問GPT-4V,您猜怎么著?它又改回去了。。

大跌眼鏡!GPT-4V錯覺挑戰(zhàn)實(shí)錄:該錯的沒錯 不該錯的反而錯了

大伙可是玩上癮了,又是一次又一次套娃。好在最終GPT-4V堅持了己見。

大跌眼鏡!GPT-4V錯覺挑戰(zhàn)實(shí)錄:該錯的沒錯 不該錯的反而錯了

總的來說,對于這種錯覺陷阱是完全沒問題。

(2)我們自己也測了一個長度錯覺題:

結(jié)果是so easy~

大跌眼鏡!GPT-4V錯覺挑戰(zhàn)實(shí)錄:該錯的沒錯 不該錯的反而錯了

再來一組找隱藏信息的圖。

很遺憾,這種對于人類來說真的還算輕松的題,GPT-4V是一點(diǎn)也搞不定。

(1)先看這張,“遠(yuǎn)看”可以看到“NYC”三個大寫字母。但它描述了一堆有的沒的,就是表示沒發(fā)現(xiàn)任何隱藏信息。

大跌眼鏡!GPT-4V錯覺挑戰(zhàn)實(shí)錄:該錯的沒錯 不該錯的反而錯了

(2)如果說上門這個有點(diǎn)隱晦,看不出也罷。但對于這種圖形隱藏,它也不行。

大跌眼鏡!GPT-4V錯覺挑戰(zhàn)實(shí)錄:該錯的沒錯 不該錯的反而錯了

它描述到的只有其中的小女孩,即使測試者讓它“往遠(yuǎn)了看,又沒有新發(fā)現(xiàn)”,也無濟(jì)于事。

不過,如果我們把這張圖片手動縮小再丟給它,它行了,看到了骷髏。

大跌眼鏡!GPT-4V錯覺挑戰(zhàn)實(shí)錄:該錯的沒錯 不該錯的反而錯了

最后是一組真實(shí)世界的錯位圖。

(1)除了開頭展示的人騎摩托,這張小貓“懸浮”,它居然對了。

大跌眼鏡!GPT-4V錯覺挑戰(zhàn)實(shí)錄:該錯的沒錯 不該錯的反而錯了

(2)這張驚悚圖,也OK。

大跌眼鏡!GPT-4V錯覺挑戰(zhàn)實(shí)錄:該錯的沒錯 不該錯的反而錯了

(3)但這個就失敗了,實(shí)際后面是一只狗和小baby的重合,它認(rèn)成法斗犬幼崽。

大跌眼鏡!GPT-4V錯覺挑戰(zhàn)實(shí)錄:該錯的沒錯 不該錯的反而錯了

(4)至于這張,它壓根兒就沒提鞋子的事兒,說了也些不痛不癢的話。

大跌眼鏡!GPT-4V錯覺挑戰(zhàn)實(shí)錄:該錯的沒錯 不該錯的反而錯了

為什么會這樣?

所以,為什么會發(fā)生上面這些情況:有的錯覺它可以識別出來,有的又表現(xiàn)得很差勁?

首先,對于顏色錯覺的圖,網(wǎng)友首先認(rèn)為是提示詞的問題。

就像兩顆小樹那張,我們問它“哪個更亮”,其實(shí)就是給了GPT-4V暗示或偏見,它會順著咱的偏見來回答。

大跌眼鏡!GPT-4V錯覺挑戰(zhàn)實(shí)錄:該錯的沒錯 不該錯的反而錯了

我們自己的測試也是如此:

大跌眼鏡!GPT-4V錯覺挑戰(zhàn)實(shí)錄:該錯的沒錯 不該錯的反而錯了

但如果我們不帶立場的問:圖中兩種顏色一樣嗎?它完全沒問題。

大跌眼鏡!GPT-4V錯覺挑戰(zhàn)實(shí)錄:該錯的沒錯 不該錯的反而錯了

不過,也有網(wǎng)友指出,當(dāng)我們問它哪棵樹更亮?xí)r,如果是非常嚴(yán)謹(jǐn)?shù)貙λ邢袼剡M(jìn)行平均,GPT-4V的回答沒有毛病。

大跌眼鏡!GPT-4V錯覺挑戰(zhàn)實(shí)錄:該錯的沒錯 不該錯的反而錯了

甚至有網(wǎng)友還用測色計實(shí)測了一把:

大跌眼鏡!GPT-4V錯覺挑戰(zhàn)實(shí)錄:該錯的沒錯 不該錯的反而錯了

大跌眼鏡!GPT-4V錯覺挑戰(zhàn)實(shí)錄:該錯的沒錯 不該錯的反而錯了

但!又有人指出如果只顯示一部分時,兩者明明一樣。

大跌眼鏡!GPT-4V錯覺挑戰(zhàn)實(shí)錄:該錯的沒錯 不該錯的反而錯了

暫且不再爭論這個問題,可以肯定的是,“提示詞”的使用方法會對它的判斷造成影響是沒問題的。

另外,網(wǎng)友發(fā)現(xiàn):

如果我們?nèi)プ穯朑PT-4V,讓它再仔細(xì)確認(rèn)一下,它也能糾正回答。

大跌眼鏡!GPT-4V錯覺挑戰(zhàn)實(shí)錄:該錯的沒錯 不該錯的反而錯了

至于無法識別遠(yuǎn)景圖像的問題,有網(wǎng)友認(rèn)為這可能是因?yàn)镚PT-4V只會從左往右地讀取圖像。

而對于“為什么有時它會和人類一樣發(fā)昏被錯覺誤導(dǎo)、完全不像個智能AI”的疑問,不少人則表示這毫不意外,是訓(xùn)練問題。

即大模型是根據(jù)人類數(shù)據(jù)、人的反饋、人的注釋進(jìn)行訓(xùn)練的,自然會產(chǎn)生和人一樣的錯誤。

大跌眼鏡!GPT-4V錯覺挑戰(zhàn)實(shí)錄:該錯的沒錯 不該錯的反而錯了

因此,還有人戲謔:

看來我們?nèi)祟悇?chuàng)造了那么多科幻作品,描述AI是如何冷酷、完美,但當(dāng)現(xiàn)在我們真正擁有它時,發(fā)現(xiàn)它也不過如此。

大跌眼鏡!GPT-4V錯覺挑戰(zhàn)實(shí)錄:該錯的沒錯 不該錯的反而錯了

(手動狗頭)

你認(rèn)為該如何讓GPT-4V的錯覺識別能力更強(qiáng)呢?

One More Thing

值得一提的是,我們也測試了其中的一些案例。

發(fā)現(xiàn)GPT-4V的表現(xiàn)不大一樣,有些題它在“我們這里”是可以的。

比如這張判斷球顏色的:

大跌眼鏡!GPT-4V錯覺挑戰(zhàn)實(shí)錄:該錯的沒錯 不該錯的反而錯了

還有這個:

盡管把大圖認(rèn)成老女人而非骷髏,但還是表明它可以“遠(yuǎn)觀” 的。

大跌眼鏡!GPT-4V錯覺挑戰(zhàn)實(shí)錄:該錯的沒錯 不該錯的反而錯了

本站所有文章、數(shù)據(jù)、圖片均來自互聯(lián)網(wǎng),一切版權(quán)均歸源網(wǎng)站或源作者所有。

如果侵犯了你的權(quán)益請來信告知我們刪除。郵箱:business@qudong.com

標(biāo)簽: 大模型 ChatGPT

相關(guān)文章

亚洲精品999| 免费毛片b在线观看| 亚洲精品人人| 亚洲精品在线看| 欧美激情91| 日韩高清a**址| 欧美在线视屏| 亚洲男人天堂2024| 激情久久久久久久| 亚洲日韩中文字幕| 99热这里只有精品8| 意大利激情丛林无删减版dvd| 国产一区二区三区四区老人| 日韩国产精品视频| 在线不卡欧美| 色琪琪免费视频网站| 亚洲欧美高清| 中文字幕大看焦在线看| 久久99热狠狠色一区二区| 蝌蚪视频在线播放| 国产精品911| 在线中文字幕视频观看| 26uuu国产电影一区二区| 亚洲最新无码中文字幕久久| 亚洲日本在线a| 国产午夜精品一区在线观看| 色综合一区二区三区| 天堂一区二区三区四区| 欧美一卡2卡3卡4卡| 希岛爱理av一区二区三区| 日韩成人黄色av| 中文高清一区| 国产在线91| 91视频观看免费| 九九热线视频只有这里最精品| 亚洲午夜三级在线| 久久综合五月婷婷| 精品国产乱码91久久久久久网站| 一区视频在线看| 九色在线播放| 久久久蜜桃精品| 四虎国产精品免费久久| 欧美美女直播网站| 亚洲国产激情| av电影在线网| 亚洲人成7777| 精品在线播放| 全网国产福利在线播放| 韩国午夜理伦三级不卡影院| 后进极品白嫩翘臀在线播放| 亚洲成人av一区| 日韩精品免费| 亚洲精品一区视频| 国产喷白浆一区二区三区| 国产一区二区久久久久| 精品黑人一区二区三区久久 | 91日韩免费| 亚洲美女在线看| 国产乱人伦偷精品视频不卡| 超级碰碰久久| 欧美日本精品一区二区三区| 日韩午夜黄色| 欧美亚洲天堂| 欧美自拍偷拍一区| 亚洲欧美日韩国产| 国内老司机av在线| 欧美亚洲日本国产| 久久国产精品久久w女人spa| 国产蜜臀一区二区打屁股调教| 五月天国产精品| 黄色成人av网站| www久久日com| 91精品91久久久中77777| 国产婷婷精品| 第一福利在线视频| 欧美巨大另类极品videosbest| 久久精品日韩欧美| 都市激情综合| 亚洲成人动漫在线播放| 国产91精品久久久久久久网曝门 | 狠狠色狠色综合曰曰| 欧美成人一品| 欧美一区二区三区在线视频| 伊人久久大香伊蕉在人线观看热v 伊人久久大香线蕉综合影院首页 伊人久久大香 | 成人欧美一区二区三区视频网页 | 999视频精品| 成人激情开心网| 亚洲国产成人精品女人| 夜色福利资源站www国产在线视频| 色婷婷国产精品综合在线观看| 91麻豆免费看片| 久久久美女毛片| av中文字幕一区二区| 欧美13videosex性极品| 欧美黄色三级| 老司机av在线免费看| 成人影院在线看| 成人线上播放| 精品一区二区三区免费毛片爱 | 成人aa视频在线观看| 岛国av一区二区在线在线观看| 欧美在线一区二区三区| 一区二区三区四区视频精品免费 | 欧美老年两性高潮| 岛国av一区二区| 日韩午夜av一区| 免费在线性爱视频| 在线日本中文字幕| 日韩av一区二区在线| 白白色视频在线| 日韩成人在线视频观看| 亚洲视频精品在线| 一本一道波多野毛片中文在线 | 爱情电影社保片一区| 日韩精品三级| 日韩av中文字幕一区| 久久精品国产68国产精品亚洲| 欧美日韩国产一区精品一区| 国产欧美三级电影| 99re这里都是精品| 国产午夜精品理论片a级大结局| 麻豆成人综合网| 国产精品网站一区| 成年人黄视频网站| 91精品国产综合久久精品图片| 诱受h嗯啊巨肉高潮| 国产福利在线免费观看| 欧美美女被草| 国产黄在线观看免费观看不卡| 成人影视在线播放| av中文在线| 日韩精品中文字幕吗一区二区| 另类激情视频| 欧美成人一二区| 国产精品嫩草99av在线| 国产精品亚洲产品| 亚洲免费精品| 亚洲激情网址| 亚洲免费网址| 一本到不卡精品视频在线观看| 国产视频二区在线观看| 不卡福利视频| 国内小视频在线看| 日韩电影在线视频| 久久国产乱子精品免费女| 亚洲午夜久久久| 日韩欧美成人免费视频| 亚洲免费av高清| 亚洲国产精品久久久| 天堂中文av在线资源库| 91麻豆精品激情在线观看最新 | 性欧美video另类hd尤物| 伊人色综合网| 日韩欧美123| 亚洲小说欧美激情另类| www.久久精品| 日韩高清电影一区| 成人直播大秀| 精品视频国内| 理论不卡电影大全神| 国产特黄在线| 91.·福利| 欧美一级淫片007| 精品成人久久av| 久久蜜桃香蕉精品一区二区三区| 老司机精品视频网站| 91免费精品| 成人盗摄视频| 成人国产一区| 欧产日产国产精品视频| 日本精品一区二区三区在线播放| 理论片播放午夜国外| 日韩精品在线看片z| 一本久久综合亚洲鲁鲁五月天 | 欧美精选一区二区三区| 国产成年精品| 欧美精品日日操| 欧美人与动牲性行为| 国产色a在线| 在线免费av网址| 亚洲欧美日韩精品| 欧美一二三区在线观看| 日本福利一区二区| 性感美女极品91精品| 一区在线播放视频| 国产午夜精品一区二区三区嫩草| 懂色一区二区三区免费观看 | 日本超碰一区二区| 福利精品在线| 欧美日韩不卡| 2019中文字幕在线电影免费 | 亚洲1区在线| 日韩精选视频| 538视频在线| 大桥未久在线播放| 中文字幕有码在线观看| 丝袜美腿美女被狂躁在线观看| 国产视频网站在线| 婷婷免费在线视频| 2021av在线|