喂给AI一张照片,它能给你推测一个人的性格
时间:2026-01-04 18:17:01 出处:综合阅读(143)
最近,个人格差评君发现了一个新东西。张照片
喂给 AI 一张照片,推测它能给你推测一个人的个人格性格。

光靠歌单就能猜出人最近的心理状态。

而这些,都来自 Kimi 最新的个人格 k1 视觉思维模型之手。
这不是张照片真的,距离上次推出数学模型 k0-math 打榜 o1 才一个月,推测 k1 快速登场。个人格
当然,张照片这个 k1 但不仅仅是推测像开头一样,只看图分析性格那么简单。个人格

上次咱测试 k0-math 已经见过的张照片时候,已经见过了 “ 做题家 ” 解决问题的推测能力和思维过程让差评君目瞪口呆。不幸的是,一些绕逻辑的数学问题有几何问题,这有点有趣。
但这次的 k1 有一种说法,既有推理能力,又有视觉能力,这意味着你可以直接拍照上传来解决问题。它还声称它可以在数学、物理和化学上打平甚至超越 Open AI 的 o1 。

如果这样比较的话,我们可以来劲。恰到好处, k1 现在新模型不需要等内测, App 可以用网页版,话不多说,我们直接打开。
上来,扔掉 K1 今年高考的几何题。

首先, k1 对题干的解读足够详细,也知道自己的目标到底是什么。
也考虑了题目给定条件中可能涉及的余弦定理,类似于我们解决问题时的思维。 a² b²− c² =2ab ,立刻想到了余弦公式 c² =a² b² -2ab·cosC 。
继续根据公式和条件推导,很快就能找到出角 B=60 °。
向上滑动,查看更多信息

第( 2 )问题有点难,但差评君仔细检查了一遍 k1 在解决问题的过程中,思路和解决方案都没有错。最后,边长 c=2√答案也是对的。(因为这个问题 k1 思维过程太长,截图不会显示。)
问同样的问题 o1 ,首先,在推理速度上, o1 的 58s 已经输了。
如果是正确的, o1 和 k1 打平手,都做对了。
不同的是, o1 隐藏回答问题的想法,不给像 k1 这样一个完整的思维过程。

但是有一句话,差评君对 k1 这种模仿人类思维的方式并不特别令人惊讶。因为上次 k0-math 模型震惊了我一次,能够意识到自己的错误,并且会反复验证,就像我写数学题时绞尽脑汁一样。
相比之下,这一次 k1 补短板更出彩。上次 k0-math 初中翻车的几何题我又拿了 k1 试了一次,现在已经可以做对了,连高考的难度都没有发出来。
而且我也发现, k1 不仅擅长数学题,物理题也不在话下。

然后,我拿出一个逻辑陷阱问题,逻辑稍微绕一点,试了试:一个西瓜的价格 50 元,卖价 70 老板接受了元 100 元假币,最后损失了多少钱?
这个问题很简单,但网民对这个问题的回答被称为各种各样的问题,据说赔钱 150 的,有说 180 的,还有说 100 的。。。
让我们来看看许多人类无法理解的问题。 k1 你能看到里面的陷阱吗?
而且这个问题我特意手写的很潦草,顺便也测了一下。 k1 视觉能力是不是像宣传的那样神?

不要说,你真的不说,这个模型 “ 眼神 ” 确实不赖。
题目正确率方面, k1 前半部分的分析首先得出了损失 100 元的回答,但很快它就否定了自己。
继续把假币,零,成本利润考虑到这些复杂的因素,我终于明白了老板的损失 80 元。( 正确答案是 80 元 )
向上滑动,查看更多信息

这种逻辑能力,确实有点强。
包括我给出几个行测的类比推理题 k1 虽然逻辑分析的路径与参考答案不同,但最终答案是正确的。

反正经过这次测试,差评君发现了 k1 思维有逻辑,眼神好,智商高。 Kimi 这 “ 做题家 ” 名字算是坐实了。
但除了做题,这次我还摸索出了更多花里胡哨的玩法。
分析数据和看报表没有意义。 k1 模型不是根据图片来推理的吗?一定要有鉴别古钱币的一手吗?
差评君特意从网上找到了民国时期银元的照片,两枚银元上假下真,发给 k1 ,浅浅来一把 “AI 版听泉鉴宝 ” 。
图源小红书用户@古董今来(公博代理收评)

k1 我们不仅知道钱币是民国时期的,还知道钱币的各种细节 kuku 一顿输出,终于真的看到上面这个是假币。

让我们随便发一张房间的照片,让我们随便发一张房间的照片 k1 看看 “ 风水 ” 。
什么 “ 气口 ” 、对称布局,能量平衡。。。说得好,甚至真的给出了建议,让我们改变床的位置,定期修剪植物,改变更简单的枝形吊灯。

吃饭的时候给 k1 拍一张照片,这顿饭吃了多少卡路里也算清楚。

但最让我惊讶的是, k1 看图猜电影的能力。
我给了它一个《 七宗罪 》电影截图,没有台词,只有画面,很多没看过这部电影的人都很难猜出来。

一开始看 k1 我以为这个大概率是黄色的,结果下一秒就是一句话 “ 拍摄角度和色调让我想起了大卫 · 芬奇的电影 ” ,还推断截图中的画面是《 七宗罪 》里面的某个场景。

真是太强了。。。
甚至一些晦涩的梗图也被扔给了 k1 ,它还可以严肃地解释笑点在哪里。

虽然有过度解读的嫌疑,但一般意义基本上都是 get 到了。

这么说吧,基于 k1 视觉和推理能力,做题都是基操,只要脑洞足够大,还能解锁更多的玩法。
而 k1 这种能力在很大程度上归功于一个叫做的能力COT ( Chain of Thought )思维链的技术。
大概意思是模型在输出答案之前,模仿人脑的思维方式,分解复杂的任务,然后一步一步地解决。该技术可以提高模型的智商。
另一方面,借助强化学习技术,模型也学会了在不断试错的过程中进化,从而达到最佳效果,就像训狗一样。

至于为啥 Kimi 将率先选择数学场景作为推理模型的切入点,我认为与我们人类学好数学锻炼思维是一样的。
在模型 “ 学好数学 ” 在此基础上,将这种逻辑推理能力应用到物理、化学甚至我们日常生活的各个方面,直到我们最终真正理解这个世界。

而很显然, Kimi 推理模型的泛化能力已经开始出现了。
这种基于强化学习技术的路径,在数据见顶的前提下,可能会使模型取得更好的效果。
但归根结底,模型使用了哪些技术,纸张分数有多高,其实大伙儿更关心模型是否好用,是否实用。
一向擅长长长长长文本的人。 Kimi ,如今,长文本和强化学习也是调整工具属性慢慢接近用户需求的表现。
毕竟,只有当技术不再高,能够帮助人们解决实际问题时,它才能真正完成它的使命。
本文来源:差评