AI产业—规模之战
尽管有人开玩笑说现在在硅谷聊AI,中文是通行语,非中文母语的人抱怨说,不来点儿中文就有点出圈的感觉,呵呵,感觉有点好,侧面反应现在硅谷AI圈,尤其是技术咖里,中国人之普遍确实是一个现象,毕竟AI教主和可能的教母,都是华裔,不过他们可都是说英文的。
真要认真的话,事实数据其实对中文文化背景的人并不乐观,大语言模型训练数据的语言占比直接影响模型的全球适用性和文化偏置。2025年,互联网内容以英文为绝对主导,这放大了训练偏差,美国模型以英文为主,占比超92%,在编码与推理任务上保持领先,但非英文语料占比低。中国模型通过提升中文语料占比至30%-50%,在本土任务上表现更优,中文准确率达85%。美国语料库虽涵盖多语种,但清洗后英文占比更高;中国则通过两个欧洲开发的语料库做模型训练,同时合成翻译数据提升中文覆盖,预计2030年中文语料自给率将超70%。
今年,美国投资领域里,最打眼的就是数据中心的投资,投入金额惊人,规模庞大,动辄千亿、几千亿美元投入,但受限于电网瓶颈与能效挑战。液冷技术虽已应用于高密度机柜,但普及率受成本制约仍然不高。相对美国在这个领域近乎白热化的积极,中国表现的按部就班,美国最吃紧的电力容量问题,在中国不是个事儿,液冷技术方案与创新也积极,但总体产业上的投资远远不如美国,与美国的算力紧张,一票难求的态势相比,中国甚至有闲置率的问题。
在AI产业引擎方面,OpenAI以模型性能与生态整合领先全球,最新估值已接近5000亿美元,中国拿的出手的是DeepSeek、Zhipu、阿里等,大概加起来估值不会超过50亿美元,但中国强调自己是开源模型,训练成本低。
最后,AI芯片方面,美国以NVIDIA与AMD主导高端市场,芯片性能与开发生态领先,出口管制进一步巩固优势。中国自给率几乎可以忽略,华为高调唱到现在,东西还是拿不出来,就算拿出来,也只是主流芯片的一个配角。
在上述的四个维度上,很明显双方差距是巨大的,首先训练的数据语言,资料和信源的文化背景差异太大,几乎是一边倒的碾压性优势,这一点没办法,不是现在的中国不努力,而是整个现代化就是母语为英语的国家开创的,近300年的积累,这方面你是无法用四十年走完人家300年的路的,也不能生造,而是必须老老实实的跟随,把基础做好,才有可能做大,如果排斥这一点,那你怎么玩也是不能出圈的,这是肯定的。
在AI基础设施的投入上,完全尊崇市场经济原则和自以为是的计划经济会走出彻底不同的路线,最后的效率和技术路线表现将大相径庭,因为这是一个典型的边创新、边建设、边淘汰、边在多方合作中逐步确定技术标准的系统性工程,也就是说,根本无从计划,根本计划不得,一旦计划,必将会被反噬,而且浪费严重,破坏力极大!那能不能等你们都试错结束,找出最佳方案之后再参与呢?可以的,只是这样的话,就不要谈竞争与可能领先,不过,和前几次工业革命不同,这次如果不能占据领先身位的话,不会有什么后发优势了,这次是智能革命,替代的是部分的大脑功能,复制的话,很有可能你就变成他了,什么意思?就是一个又红又专的共产主义战士想抄近路,玩后发优势快速复制,结果完成后你变成资本主义大坏蛋了,而且又黑又专,无法回头。
产业引擎方面,整个七大群体都是主角,加上OPEN AI,还有许许多多的新晋独角兽,以及各种层面的企业参与应用,让美国的AI产业发展,活力无穷,长效性满满。其实现在不管是基础设施建设还是应用层,长臂已经延伸到欧洲和东南亚地区了,这方面是目前中国完全无法比对美国的所在,除了字节跳动让人感觉在AI应用上进展明显,其它几家实在乏善可陈,精力都放在外卖抢单上了吧。
芯片方面差距就更大了,其实这个问题上,大众的认知,甚至川大总统都相对有限,有一定的技术封锁和限制是必要的,但没必要搞的过头,黄仁勋说的是表面官话,什么封锁反而会激发他们的创造力之类的话,更真实的情况是,他对GPU技术发展有十足的把握,尤其是下面数代的GPU完全不是单个单元芯片唱戏,那是一个巨大的系统工程,多方参与的,而且是一个必须在自由竞争的,充分市场化的体系下才能做出来的东西,因为这个过程需要完全自主的多次磨合与适配,只有充分市场化的环境才能做,GPU未来会是一个集群,结合特殊适配的数据中心和许多环节共同辅助运作才能发挥巨大能力的系统,这岂是一个达到了顶级纳米要求的芯片能做的事。
整个AI产业很大,我说的并不全面,但把核心的脉络整理出来了,得出的结论是,所谓的中美AI争夺战根本就是个伪命题,完全不在一个维度上,差距太大了,而且是越拉越大,在AI发展的早期,它就是一个规模之战了,数据积累也好,数据中心和GPU集群也罢,各种应用的广度和深度,不达到一定规模,这个产业是起不来的,甚至缺少几个环节都不行,至今中国没有一家万亿美元的企业,就算腾讯很大,也只是一个区域性的的企业,甚至谈不上国际大企业,而AI要求的基座巨大,不到一定规模,是根本玩不转的.
互联网你可以美国弄个谷歌,你自己搞个百度,以此类推,复制很多中国版,AI大概率不允许这样,非要这样你就玩不转。
虽然中国在电动车和机器人产业与技术上的发展比较明显,对整体AI产业而言,这两块拼图只是应用的基座,不是主流,主流是自动驾驶和未来装在机器人脑袋里的类人大脑,这才是AI的主流,那是需要多环节的规模聚集才能出成果的,我认为中国现在在这方面的认识不足.
讽刺的一点是我在撰写此文时向中国AI提问,中国最大市值的企业是哪一家,它给我的答案是台积电,并且自动向我宣传为什么这么说,是根据国家哪条哪项规定得出的结论,行吧,它好强硬啊,那就是台积电吧,我下次不问了,又不是只有一家可以问!
更多我的博客文章>>>
