我认为LLM 算法一直会改进,目前Deepseek出现,相当于定制版的LLM,或者硬件中的ASIC,就是针对它要分析的数据做定制的算法。
https://wallstreetcn.com/articles/3738170
文章中提到deepseek用的是在开头筛选数据源里的信息,利用A800的芯片特点,提高parallel的处理数据能力,同时侧重处理某些类型的数据,而弱在某些方面的数据处理。总之是看到数据,然后偏科处理,这样在大多数方面反应速度不错,但是全面分析来看,还有欠缺。对大多数专业的需要精密和准确的判断工作来说,没法用,因为它的一个错误信息就会导致失去同行的信任。
这种实际上是NVDA必须要面对的,我在2023年就有类似的判断,对NVDA是好事,因为GPU需要面对不同的task做处理。今天是不同的算法,明天可能是不同的task,训练robot,或者训练某个行业的智能系统如无人战斗机。而这可是avgo这种定制芯片系统的风险。