DeepSeek R1推理功夫了得!

本帖于 2025-01-27 21:41:36 时间, 由普通用户 slow_quick 编辑

注意,要点一下左下角的 DeepThink (R1) 。

我问了这个经典问题:

Say there are more than one finite number of points on a Euclidean plane, and they are not falling on a single straight line.  Proof that there exists a straight line that goes through only two of those finite points.

它洋洋洒洒考虑了好几分钟,写了好几段怎么思考,最后居然证明了!

 

所有跟帖: 

我完全不懂AI,就觉得都很神奇 -slow_quick- 给 slow_quick 发送悄悄话 slow_quick 的博客首页 (0 bytes) () 01/27/2025 postreply 21:40:17

问ChatGPT同一问题,解答快得多也简洁许多。目前DeepSeek还嫩了点 -slow_quick- 给 slow_quick 发送悄悄话 slow_quick 的博客首页 (0 bytes) () 01/27/2025 postreply 22:39:25

我仔细阅读了一下,ChatGPT的证明不完全,差评 -slow_quick- 给 slow_quick 发送悄悄话 slow_quick 的博客首页 (138174 bytes) () 01/27/2025 postreply 22:46:06

ChatGPT4 推理一般,o1应该没有问题,AIME考试能到83分。 -pichawxc- 给 pichawxc 发送悄悄话 pichawxc 的博客首页 (0 bytes) () 01/27/2025 postreply 22:59:05

ChatGPT o1也错得离谱 -slow_quick- 给 slow_quick 发送悄悄话 slow_quick 的博客首页 (0 bytes) () 01/28/2025 postreply 09:44:58

DeepSeek R1 虽然啰嗦了点,却是正确的证明! -slow_quick- 给 slow_quick 发送悄悄话 slow_quick 的博客首页 (0 bytes) () 01/27/2025 postreply 22:46:57

R1深度思考和推理,所以慢一些 -玻璃坊- 给 玻璃坊 发送悄悄话 玻璃坊 的博客首页 (0 bytes) () 01/27/2025 postreply 23:17:36

再仔细阅读一下,Deepseek 也错了,但更接近 -slow_quick- 给 slow_quick 发送悄悄话 slow_quick 的博客首页 (0 bytes) () 01/27/2025 postreply 23:58:46

明天空了贴上来大家评论 -slow_quick- 给 slow_quick 发送悄悄话 slow_quick 的博客首页 (0 bytes) () 01/28/2025 postreply 00:00:36

我昨天是在tablet app上问DS R1,今天换到电脑上browser问同一个问题,它完全错了 -slow_quick- 给 slow_quick 发送悄悄话 slow_quick 的博客首页 (151 bytes) () 01/28/2025 postreply 07:23:47

把你的问题Post到 https://lmarena.ai/, 看看哪个模型的回答更好? -未知- 给 未知 发送悄悄话 未知 的博客首页 (106 bytes) () 01/27/2025 postreply 23:37:19

我的观察:目前所有AI都是学会了说人话,学术问题绝对可以唬唬外行,但内行一看就不对 -slow_quick- 给 slow_quick 发送悄悄话 slow_quick 的博客首页 (0 bytes) () 01/28/2025 postreply 07:05:39

一分钱一分货,历来如此。驱良币会发生,更精确讲是成本下降。 -上海大男人- 给 上海大男人 发送悄悄话 上海大男人 的博客首页 (0 bytes) () 01/28/2025 postreply 07:08:58

同样的问题,chatgpt 回答的如何? -拍浪- 给 拍浪 发送悄悄话 (0 bytes) () 01/28/2025 postreply 07:21:38

很好的体验,多谢回复。 -拍浪- 给 拍浪 发送悄悄话 (0 bytes) () 01/28/2025 postreply 09:15:44

请您先登陆,再发跟帖!