大跌眼镜!GPT

时尚 2025-03-04 04:10:20 1884

GPT-4V 挑战视觉过错图 ,大跌服从使人“大跌眼镜”。眼镜

像这种分说“哪边颜色更亮”的大跌题,一个没做对于:

读图片中潜在信息的眼镜也傻傻看不出,奈何样问都说“不啊”:

可是大跌呢 ,这种人类乍一看相对于会错的眼镜图,它又乐成答对于:

以及这样的大跌错位图,它对于了又没残缺对于。眼镜。大跌

(GPT-4V 直接看进去头盔是眼镜位于男的大腿上的 ,不女的大跌 ,但它仍是眼镜展现图里有俩人 ,另一个躲在男的大跌去世后戴着那顶头盔 ==)

看完这些 ,是眼镜否感应很迷 ?

全部一“该对于的不同过错,该错的大跌又对于了” 。

测试者则展现:

在测以前,他以为 GPT-4V 对于这种挑战残缺不在话下 ,谁知服从竟是这样。

不止是他  ,网友也都不清晰 GPT-4V 作为一个“精准的”AI 零星,按理很智能 ,为甚么还会犯以及人类截然差距的错觉 ?  ?!

以是  ,这事实奈何样回事?

下面是来自网友的更多测试案例。

首先是次次都过错的颜色错觉题 。

(1)除了收尾的两颗小树图,尚有这个 :

问它哪边的绿色更亮一些 ,果不其然仍是右侧亮,右侧暗 ,实际显明都同样 。

(2)尚有这张稍微重大一点的:

两只眼睛着实都是灰色 ,但让 GPT-4V 来形貌图像时 ,它回覆一只为蓝色,另一只做了灰度处置,无奈患上悉颜色 。

(3)这张就更别提了 ,直接被瞎搅地去世去世的 。

尽管,这简直很难,大部份人类也识别不进去所有的球着实都是棕色 。

其次是会发生动态错觉的图 。

(1)有一点意外 ,当咱们问 GPT-4V“你望见了甚么 ?形貌细节”时 ,它直接挑明了这是一张看久了就会让人发生眩晕感的错觉图 ,本性便是一些海浪线而已经 。

(2)这张也不难倒它。

但怪异的是问它图中有多少种颜色 ,它奈何样都只能识别出黄色以及蓝色,看不到玄色以及红色。

接下来是另一类比力平面的错觉图。

(1)如收尾所示的这张 :

艰深人类真的展现很懵圈 ,可是 GPT-4V 居然对于了 。

But  ,别急!  !有人拿着测试者的图去问“自己的”GPT-4V,让它再魔难一下时 ,它居然修正了谜底 。

可是还没完。品评区惊现套娃操作,有人又拿着这俩人的对于话图再问 GPT-4V,您猜奈何样着 ?它又改回去了 。。

大伙可是玩上瘾了,又是一次又一次套娃 。幸好最终 GPT-4V 坚持了己见 。

总的来说,对于这种错觉陷阱是残缺没下场。

(2)咱们自己也测了一个长度错觉题:

服从是 so easy~

再来一组找潜在信息的图。

很遗憾,这种对于人类来说真的还算轻松的题 ,GPT-4V 是一点也搞不定 。

(1)先看这张 ,“远看”可能看到“NYC”三个大写字母。但它形貌了一堆有的没的,便是展现没发现任何潜在信息 。

(2)假如说上门这个有点费解 ,看不出也罢 。但对于这种图形潜在 ,它也不可 。

它形貌到的惟独其中的小女孩,纵然测试者让它“往远了看,又不新发现” ,也无济于事。

不外 ,假如咱们把这张图片手动削减再丢给它,它行了 ,看到了骷髅 。

最后是一组着实天下的错位图 。

(1)除了收尾揭示的人骑摩托,这张小猫“悬浮” ,它居然对于了。

(2)这张惊悚图  ,也 OK 。

(3)但这个就失败了 ,实际前面是一只狗以及小 baby 的重合 ,它认成法斗犬幼崽。

(4)至于这张 ,它压根儿就没提鞋子的事儿,说了也些不痛不痒的话 。

以是,为甚么会爆发下面这些情景:有的错觉它可能识别进去 ,有的又展现患上很优异 ?

首先,对于颜色错觉的图 ,网友首先以为是揭示词的下场。

就像两颗小树那张,咱们问它“哪一个更亮” ,着实便是给了 GPT-4V 展现或者私见  ,它会顺着咱的私见往返覆。

咱们自己的测试也是如斯 :

但假如咱们不带态度的问 :图中两种颜色同样吗 ?它残缺没下场。

不外,也有网友指出 ,当咱们问它哪棵树更亮时 ,假如黑白常松散地对于所有像素妨碍平均  ,GPT-4V 的回浸没出倾向 。

致使有网友还用测色计实测了一把 :

但!又有人指出假如只展现一部份时 ,两者显明同样 。

临时再也不争执这个下场 ,可能确定的是 ,“揭示词”的运用措施会对于它的分说组成影响是没下场的 。

此外,网友发现 :

假如咱们去诘责 GPT-4V,让它再子细确认一下,它也能更正回覆 。

至于无奈识别远景图像的下场,有网友以为这可能是由于 GPT-4V 只会从左往右地读取图像。

而对于“为甚么无意它会以及人类同样发昏被错觉误导、残缺不像个智能 AI”的疑难  ,良多人则展现这绝不意外 ,是磨炼下场 。

即大模子是凭证人类数据 、人的反映 、人的诠释妨碍磨炼的,做作会发生以及人同样的过错 。

因此 ,尚有人戏谑 :

看来咱们人类缔造了那末多科幻作品,形貌 AI 是若何冷漠、欠缺 ,但当如今咱们真正具备它时,发现它也不外如斯 。

(手动狗头)

你以为该若何让 GPT-4V 的错觉识别能耐更强呢?

值患上一提的是 ,咱们也测试了其中的一些案例 。

发现 GPT-4V 的展现不大同样,有些题它在“咱们这里”是可能的。

好比这张分说球颜色的 :

尚有这个:

尽管把大图认成老姑娘而非骷髅 ,但仍是表明它可能“远不雅” 的 。

参考链接:

本文来自微信公共号 :量子位 (ID :QbitAI) ,作者 :丰色

广告申明  :文内含有的对于外跳转链接(搜罗不限于超链接 、二维码 、口令等方式) ,用于传递更多信息,节约甄选光阴,服从仅供参考,IT之家所有文章均搜罗本申明 。

本文地址:https://kbihpjz.strain.blog/news/324b599654.html
版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。

全站热门

独行侠轻取爵士,东契奇创历史!

中超|前金靴马尔康回归武汉三镇

哈登损失一个亿,被莫雷害惨,经纪人表明下一步计划,快船很无奈

恭喜掘金!1年底新达成签约!冠军中锋仍在阵中,下赛季还要争冠再见哈登,史诗级3换1交易!恩比德喜结良缘,76人老板豪掷千金

英超最新积分榜:国际第一联赛真乱,竟有五大奇观,到处是大哥!

一箭双雕?勇士送走普尔迎来保罗,为了争冠也为了更衣室稳定

重庆大学机械传动国家重点试验室凋谢基金课题恳求

福克斯更新INS晒退出吹杨婚礼照:祝愿

友情链接