DeepSeek、ChatGPT和JePA的比较与影响,以及它们会对NVDA和AVGO的芯片的影响,请AI大牛指正

本帖于 2024-12-28 15:15:09 时间, 由普通用户 BrightLine 编辑

DeepSeek、ChatGPT和JePA的比较与影响

人工智能技术的快速发展催生了许多重要的创新,其中DeepSeek、ChatGPT和JePA分别代表了语义搜索、生成式AI和自监督学习领域的前沿技术。它们在技术核心、应用场景和潜在影响方面各具特色,同时也对底层硬件特别是NVIDIA和Broadcom(AVGO)芯片的发展产生了深远影响。

---

1. DeepSeek

DeepSeek是一家专注于语义搜索和信息检索的AI平台,核心技术集中在精准语义理解和多模态搜索。

技术特点:

基于深度学习模型(如Transformer)优化语义搜索。

支持多模态数据(文本、图片、视频)融合。

专注于特定行业的定制化解决方案,能够提供垂直领域的精准结果。

应用场景:

企业知识管理,通过语义搜索提升内部信息检索效率。

电商平台,优化用户购物体验,例如通过图文结合搜索商品。

医疗和法律等领域,为专业人士提供高精度信息。

优势与不足:

优势:高精度、低延迟的搜索能力;支持多模态数据。

不足:对硬件性能依赖高,泛化能力不如通用模型。

---

2. ChatGPT

ChatGPT是OpenAI开发的生成式AI,专注于自然语言生成和多轮对话,具有强大的语言表达能力和泛化能力。

技术特点:

基于大型语言模型(LLM),以Transformer架构为核心。

能够生成自然流畅的文本,支持复杂的多轮对话。

依赖大规模训练数据,覆盖广泛领域。

应用场景:

内容创作,如生成文章、代码或广告文案。

教育和辅导,为学生提供个性化学习支持。

客户服务,通过对话式AI提高用户互动体验。

优势与不足:

优势:通用性强,适应多种任务;语言生成自然流畅。

不足:对计算资源需求极高,有时生成内容缺乏事实性。

---

3. JePA,(META)

JePA(Joint Embedding Predictive Architecture)是一种以自监督学习为核心的AI技术,强调跨模态表征和泛化能力。

技术特点:

基于元学习和自监督学习,减少对标签数据的依赖。

专注于多模态理解和表征,例如语言与视觉的联合分析。

通过预测任务(如图文跨模态映射)提升模型泛化能力。

应用场景:

跨模态搜索,如从图像生成描述或从描述检索相关图像。

自动驾驶,通过视觉与语言的联合优化感知系统。

虚拟现实(VR/AR),实现自然的视觉与语言交互。

优势与不足:

优势:数据高效,适用于跨模态任务;泛化能力强。

不足:技术复杂,对硬件资源需求较高,应用生态尚未成熟。

---

Broadcom(AVGO)芯片的使用分析

在DeepSeek、ChatGPT和JePA中,Broadcom芯片的使用主要体现在以下几个方面:

1. 数据中心与网络基础设施:

Broadcom的ASIC和网络交换芯片被广泛应用于支持高性能计算的数据中心。

DeepSeek和ChatGPT依赖的云服务(如AWS、Azure)通常使用Broadcom的高带宽网络芯片和存储控制器,以保证训练和推理过程中的高速数据传输。

2. 支持底层架构:

DeepSeek:间接使用Broadcom芯片,用于优化数据中心的网络通信和存储效率。

ChatGPT:在大型模型训练和推理过程中,数据中心中可能部署了Broadcom的交换芯片以提升整体性能。

JePA:在跨模态任务的执行中,如果部署在边缘设备(如IoT),可能更直接使用Broadcom的无线通信芯片。

3. 边缘设备中的潜力:

JePA扩展到IoT和移动设备时,可能更多依赖Broadcom的无线通信芯片以满足边缘计算需求。

Broadcom的芯片虽然不直接执行AI计算,但其在数据传输、网络优化和存储支持中的作用不可忽视,尤其是在高效运行AI应用的基础设施层面。

---

对NVIDIA芯片的影响

这三种技术对NVIDIA芯片的需求和影响主要体现在以下几个方面:

1. 大规模训练需求:

DeepSeek和ChatGPT依赖大规模数据和模型训练,NVIDIA的A100和H100 GPU成为此类任务的首选。

JePA尽管依赖自监督学习,但其多模态预测任务同样需要强大的计算能力。

2. 实时性和推理需求:

DeepSeek的低延迟搜索需求对GPU性能提出了极高要求,尤其是并行计算能力。

ChatGPT的多轮对话需要处理复杂的语言逻辑,同样依赖NVIDIA的高性能硬件。

JePA在跨模态推理中需要更高的硬件灵活性,例如结合NVIDIA的DPU(数据处理单元)和边缘计算产品。

3. 市场需求扩张:

数据中心市场的持续增长为NVIDIA芯片提供了广阔的发展空间,尤其是支持DeepSeek和ChatGPT的大型云服务平台。

边缘计算的兴起可能推动NVIDIA Jetson系列在轻量化任务中的应用,例如JePA的移动端部署。

---

总结与展望

DeepSeek、ChatGPT和JePA分别在语义搜索、生成式AI和自监督学习领域引领技术潮流,它们不仅推动了AI应用场景的多样化,也为底层硬件市场注入了新的需求动力。NVIDIA作为AI芯片的核心供应商,受益于这些技术的发展,而Broadcom则在底层网络和存储支持方面扮演了重要角色。

未来,随着AI模型规模和多模态能力的提升,DeepSeek、ChatGPT和JePA的技术差异将进一步深化,共同推动AI生态系统的进化,同时也为NVIDIA和Broadcom这样的芯片供应商提供持续的市场增长动力。

所有跟帖: 

赞!长期持有AVGO,起码五年 -青裁- 给 青裁 发送悄悄话 (0 bytes) () 12/28/2024 postreply 12:59:00

好,观察找机会进货,哈哈 -BrightLine- 给 BrightLine 发送悄悄话 BrightLine 的博客首页 (0 bytes) () 12/28/2024 postreply 13:01:41

AVGO的定制芯片会越做越大,NVDA通用芯片是好,但贵,能耗大 cooling 太费劲 -青裁- 给 青裁 发送悄悄话 (0 bytes) () 12/28/2024 postreply 13:08:00

对,两个都买,哈哈 -BrightLine- 给 BrightLine 发送悄悄话 BrightLine 的博客首页 (0 bytes) () 12/28/2024 postreply 13:10:43

AVGO母公司是新加坡的,有可能做中美的中间人 -青裁- 给 青裁 发送悄悄话 (0 bytes) () 12/28/2024 postreply 13:11:00

简而言之,NVDA会继续领头,AVGO配合,但是AVGO现在增长速度比NVDA还快,哈哈 -BrightLine- 给 BrightLine 发送悄悄话 BrightLine 的博客首页 (557 bytes) () 12/28/2024 postreply 13:09:55

其实AI的前半程GPU,大模型已经做的不错了,也耗费巨资,但是下半场场景应用在美国实行不了 -青裁- 给 青裁 发送悄悄话 (86 bytes) () 12/28/2024 postreply 13:23:02

但是不搞AI,就是死路一条。想想如果Google 不搞AI,很快就会被淘汰 -QQQ2074- 给 QQQ2074 发送悄悄话 (0 bytes) () 12/28/2024 postreply 13:45:23

我在寻找可以拿20年的股 推荐几个啊 -青裁- 给 青裁 发送悄悄话 (0 bytes) () 12/28/2024 postreply 13:18:00

NVDA, AVGO -QQQ2074- 给 QQQ2074 发送悄悄话 (0 bytes) () 12/28/2024 postreply 13:34:48

ChatGPT估计NVDA还能存活20-30年。哈哈 -青裁- 给 青裁 发送悄悄话 (244 bytes) () 12/28/2024 postreply 13:45:15

哪个可以分析股票? 比如给我一个20年SPY 和QQQ的annual return table -QQQ2074- 给 QQQ2074 发送悄悄话 (0 bytes) () 12/28/2024 postreply 13:26:06

感觉AI很花钱,是不是小公司很难充出来? -QQQ2074- 给 QQQ2074 发送悄悄话 (0 bytes) () 12/28/2024 postreply 13:36:12

小公司不需要自己从头做平台,可以使用已经成熟的平台,如ChatGPT做他们领域的AI。 -parentb- 给 parentb 发送悄悄话 parentb 的博客首页 (0 bytes) () 12/28/2024 postreply 14:19:22

小公司可以做AI应用,哈哈,就像PLTR,AI,SNOW,Data brick, NOW等 -BrightLine- 给 BrightLine 发送悄悄话 BrightLine 的博客首页 (0 bytes) () 12/28/2024 postreply 14:20:52

很花钱,不算GPU,训练一次大模型,要花6个月计算,$0.5B花费 -未知- 给 未知 发送悄悄话 未知 的博客首页 (201 bytes) () 12/28/2024 postreply 14:38:22

比我分析有深度,上星期五已加了一些AVGO,以后跌就再加! -lionhill- 给 lionhill 发送悄悄话 (0 bytes) () 12/28/2024 postreply 15:37:18

外行乱弹情。AVGO在存储上没有任何优势。。。 -颜阳- 给 颜阳 发送悄悄话 颜阳 的博客首页 (0 bytes) () 12/28/2024 postreply 16:41:21

你来分析一下? -BrightLine- 给 BrightLine 发送悄悄话 BrightLine 的博客首页 (0 bytes) () 12/28/2024 postreply 17:15:29

抄来的东西所以胡说八道的多。AVGO买了LSI,但是LSI只做CONTROLLER的,它不掌握关键的CHANEL技术 -颜阳- 给 颜阳 发送悄悄话 颜阳 的博客首页 (167 bytes) () 12/28/2024 postreply 17:22:49

我对软件懂的比较多,对AVGO其实不太懂,我去研究一下,哈哈,不用太Harsh -BrightLine- 给 BrightLine 发送悄悄话 BrightLine 的博客首页 (200 bytes) () 12/28/2024 postreply 17:34:13

您是搞哪一行的?可否麻烦您发表一下您的看法? -Austin8- 给 Austin8 发送悄悄话 (124 bytes) () 12/28/2024 postreply 19:45:23

这样看AVGO太细了,不是不好,但有陷进技术的小胡同,而忽略了一些明显的基本面的大转变。 -三心三意- 给 三心三意 发送悄悄话 (1205 bytes) () 12/28/2024 postreply 17:28:09

这也是为什么AVGO财报后开始股价只涨了3点,但Hock的60-90B话音一落,它的股价就狂飙25点的原因 -三心三意- 给 三心三意 发送悄悄话 (0 bytes) () 12/28/2024 postreply 17:32:27

好,谢谢 -BrightLine- 给 BrightLine 发送悄悄话 BrightLine 的博客首页 (0 bytes) () 12/28/2024 postreply 17:35:19

虽然已经是我的重仓个股之一,我这次准备在150-160再次加仓(如果回调回到那) -三心三意- 给 三心三意 发送悄悄话 (0 bytes) () 12/28/2024 postreply 17:37:56

好,我等等,不能像nvda建仓太早,哈哈 -BrightLine- 给 BrightLine 发送悄悄话 BrightLine 的博客首页 (15 bytes) () 12/28/2024 postreply 17:41:10

是的, 要有耐心:) -三心三意- 给 三心三意 发送悄悄话 (0 bytes) () 12/28/2024 postreply 17:42:56

请您先登陆,再发跟帖!