ZT 黄仁勋:想对华销售新型特供芯片,正在与美国政府磋商
此前有消息人士披露,英伟达正为中国市场开发一款名为B30A的AI芯片,其性能将超过先前的H20芯片。对此,黄仁勋回应说:“我们正在向中国提供一种新产品,是H20的后续产品,用于AI数据中心。但我们不能作出决定,当然,这取决于美国政府。”该芯片基于英伟达最新的Blackwell架构,采用单芯片设计,原始算力可能为英伟达旗舰产品B300芯片的一半。
----------------------------------------------------------------------------------------------
深度求索(DeepSeek)時隔近5個月再度宣布對V3基座模型進行升級,新發布的DeepSeek-V3.1模型支持混合推理架構,有更高的思考效率和更強的智能體(Agent)能力。V3.1的Base模型在V3的基礎上重新做了外擴訓練,一共增加訓練了840B大小的tokens。Base模型與後訓練模型均已開源。V3.1使用了UE8M0 FP8 Scale的參數精度。這是當前大模型訓練與推理中的一種高效低精度量化技術。
ZT: DeepSeek V3.1正式发布,专为下代国产芯设计
这事儿为啥能让圈内人这么激动?因为天下苦英伟达久矣。
在 AI 圈,英伟达的 GPU 和 CUDA软件生态,就像是孙悟空头上的紧箍咒。你想搞 AI,基本上就得在它的规则里玩。过去,我们很多时候的思路是硬件追赶。先造出个差不多的芯片,再去求着软件和算法来适配。结果往往是,硬件出来了,软件跟不上,最后英雄无用武之地。而 DeepSeek 这次直接反过来,玩了一招软件定义硬件,生态同步生长。它不等芯片发布,就提前在自己的核心模型里,把路给铺好了。这次虽然是个小版本的更新,但我觉得还是很有意义的,除了宣布了专为下一代国产芯片设计的重磅消息。
DeepSeek-V3.1 此次在工具调用和 Agent 的支持上有显著增强。