把长文变成图,再用ocr看文,DS新的大模型据说用这方法可以减少算力消耗,我不懂,探春可以批判下。

所有跟帖: 

DS-OCR? -cn_abcd- 给 cn_abcd 发送悄悄话 cn_abcd 的博客首页 (0 bytes) () 10/22/2025 postreply 11:15:15

她懂个啥? 符合她想法的就一定是真的。否则就不值一提 -大洋bridge- 给 大洋bridge 发送悄悄话 大洋bridge 的博客首页 (0 bytes) () 10/22/2025 postreply 11:16:30

投记取巧术,鉴定完毕 - ncaa -青雨紫烟- 给 青雨紫烟 发送悄悄话 青雨紫烟 的博客首页 (0 bytes) () 10/22/2025 postreply 11:19:58

这确实不理解。OCR不是又还原成原来的text文字了?大概是OCR过程的某个中间产品吧, -大洋bridge- 给 大洋bridge 发送悄悄话 大洋bridge 的博客首页 (0 bytes) () 10/22/2025 postreply 11:21:54

据说能提高十倍效率,算是惊人突破了, -大洋bridge- 给 大洋bridge 发送悄悄话 大洋bridge 的博客首页 (0 bytes) () 10/22/2025 postreply 11:23:42

有些人可以一目十行,还有所谓一图胜千言。在计算机上也应该能够实现, -大洋bridge- 给 大洋bridge 发送悄悄话 大洋bridge 的博客首页 (0 bytes) () 10/22/2025 postreply 12:15:38

不太可能。大语言模型处理text比处理图形容易,同时步骤越多失真也越严重。 -大观园的贾探春- 给 大观园的贾探春 发送悄悄话 大观园的贾探春 的博客首页 (0 bytes) () 10/22/2025 postreply 11:33:41

中文很美丽文章但是逻辑混乱,他们就像小孩子一样化下来,但是语言的逻辑是化不出来的。而且cumulate errors -青雨紫烟- 给 青雨紫烟 发送悄悄话 青雨紫烟 的博客首页 (0 bytes) () 10/22/2025 postreply 11:39:09

对了他们倒退回类比象形文字,哈哈哈,just joking -青雨紫烟- 给 青雨紫烟 发送悄悄话 青雨紫烟 的博客首页 (0 bytes) () 10/22/2025 postreply 12:16:04

噗通噗通 -BJming- 给 BJming 发送悄悄话 (0 bytes) () 10/22/2025 postreply 11:48:26

我瞎猜一番:可能是变成图形后,DS一眼就能看出来这篇文章在说啥。就像我们看人一样,一眼就能看出来谁是谁。 -小米干饭- 给 小米干饭 发送悄悄话 (0 bytes) () 10/22/2025 postreply 12:14:05

请您先登陆,再发跟帖!