
黄仁勋的H20也许真的要提前“退役”了
应用介绍
还是黑色的夹克、从容的神色,黄仁勋表示只会逗留几个小时,和台积电高层吃个晚餐就会离开。此行的目的是感谢台积电在英伟达下一代AI芯片平台Rubin方面的工作——台积电正在为英伟达制造六款新产品,包括新的中央处理器和用于高级计算特别是AI的通用处理器。
就在此行之前,The Information报道称英伟达已经要求其零部件供应商停止与H20芯片相关的生产。
黄仁勋没有直接承认或否认“停产”传闻,但是当被问及传闻中的下一代“中国”B30A的时候,他透露英伟达正在就一款新的中国芯片和美国进行谈判。
这是H20一波三折的命运中最新的一个转折,人们想知道这会不会是H20的句号。更大的视角来看,英伟达已经挣扎了三年的中国版,是不是真的行得通?以后还能不能继续行得通?
就在黄仁旭抵达中国台湾之前不久,该消息由The Information曝出。据知情人士,英伟达公司已指示包括韩国三星电子、美国安靠科技(Amkor)等关键零部件供应商暂停与H20芯片相关的生产。H20的封装由安靠负责,三星电子则提供高带宽的内存芯片。
H20基于Hooper架构,牺牲训练通用算力,强化内存和IO优势,是英伟达在美国芯片禁令下,针对中国市场推出的“合规版”。它曾经一度是英伟达在中国销售受阻的情况下“全村的希望”,给中国收入贡献的比例达到80%。
·7月31日,国家互联网信息办公室要求英伟达就H20漏洞后门安全风险问题进行说明并提交相关证明材料。
年初时,DeepSeek让英伟达陷入了一场舆论危机。彼时DeepSeek的推理模型R1推出,以小成本的投入达到了惊人的效果,一时间“缩放定律已死”的论调冲击着市场对英伟达的信心。过去几年间,AI头部企业大力投入,英伟达作为最大的AI芯片供应商赚得盆满钵满。
那个时候,黄仁勋不得不给市场做“教育”工作,不断阐释为什么推理趋势并非不利于英伟达。另一面,DeepSeek的爆火,也的确让中国科技巨头重新重视“版”芯片H20,追加订单的消息不断传出。
就在这场舆论危机逐渐扭转为有利于英伟达的局面时,特朗普政府考虑缩紧芯片出口限制、把H20也禁止出口中国的消息传出,英伟达继续渡劫。
4月,有消息称黄仁勋亲自出面游说,已经让白宫放弃了这个念头。结果这个消息还没等市场完全消化,H20真的被禁了,特朗普政府要求英伟达在未经其许可的情况下,禁止在中国销售H20芯片。
他也确实再次扭转局面,三个月后,7月15日,黄仁勋现身北京,宣布了H20解禁的好消息。消息一出,资本市场反应热烈,英伟达市值一夜之间增加超过万亿元(1600亿美元)。
当他吞下这个代价,决定即便如此也要让H20恢复在中国的销售时,恐怕没有想到,一个多月后,中国也开始质疑H20的安全性,H20面临停产命运。
今年以来,黄仁勋已经来了中国大陆3次(1月、4月、7月),中国台湾3次(1月、5月、8月)。虽然一些行程被形容和H20并无直接关系,但是这样的访华频次明显超过往年,却依然没有阻止H20走向终点。
当时距离ChatGPT问世还有一个多月,那年8月发布的英伟达季度财报显示总收入67亿美元,中国市场贡献了24%的收入。
美国芯片出口管制已经存在多年,最早可以追溯到2015年。2022年10月,美国商务部“先进计算芯片出口控制规则”,禁止出口“先进节点”芯片(14nm以下工艺)和高性能AI芯片到中国,对总处理性能和性能密度都做了限制,还限制云服务和超级计算机组件。此外引入“推定拒绝”许可政策,即申请出口此类芯片到中国的许可证几乎不可能获批。
这是一次重大的禁令升级,从此前针对性的禁令,转变为了面状覆盖。这一纸禁令,直接让英伟达当时的两代旗舰芯片——2020年推出的A100和2022年3月推出的H100无法出口中国。
禁令下,英伟达迅速做出反应,先是在禁令颁布的次月就推出了A100的中国替代版A800,又在2023年3月推出了H800,作为H100在中国市场的替代版本。英伟达第一代芯片诞生,策略是带宽,保留算力。
最初的快速反应建立在中国市场长久以来对英伟达的重要性上,但很快,“中国”的意义在AI叙事下变得不同。
这次禁令升级仅仅一个月之后,英伟达就迎来一次剧烈的转折:ChatGPT发布,OpenAI成为明星企业,全球掀起AI浪潮,英伟达作为“卖水人”收入、股价、市值坐上火箭。
就在H800推出的同一个月,2023年3月,黄仁勋身穿标志性的黑色皮衣,在GTC现场宣称“AI的iPhone时刻来到”。
半年多后,2023年10月,美国商务部更新规则,进一步收紧“芯片禁令”。将2022禁令扩展到性能略低的变体。新增对“推理”芯片限制,阈值调整为TPP≥1600(针对中端芯片)。禁止出口到其他国家转运中国,还包括设备制造工具。
其中H20是H800之后的又一基于Hooper架构的版高性能训练芯片。从规格上看,H20对比原始H100做出了大刀阔斧的性能取舍,峰值算力被限制到仅约296 TFLOPs(以INT8计),这个数字甚至低于消费级RTX 4090显卡的661 TFLOPs,更远低于H100的1979 TFLOPs。
但减法之余,H20在缓存和内存带宽上做了“加法”优化:配备了96GB的HBM3高带宽显存,显存带宽提升至4TB/s;二级缓存也达到60MB,高于H100的50MB;完整保留了第四代NVLink高速互联接口,芯片间互联带宽高达900GB/s,并支持多达8卡通过NVLink构建HGX服务器。
也就是说,第一代芯片“带宽,保留算力”,在新规下的第二代芯片则刀法精准地“算力,优化带宽”,H20扛起了英伟达在中国的希望。
但之后发生的事情我们都知道了,正如前文所说,尽管黄仁勋使出浑身解数,也没能阻止美国在今年4月禁止H20在中国的销售,而在以15%“保护费”换取H20在华解禁之后没多久,H20又面临中国的质疑。这款芯片,很有可能提前“退役”。
在这漫长的三年里,黄仁勋对美方禁令的态度逐渐从温和走向对抗。起初黄仁勋只论中国对英伟达的重要性,后来转变为对出口管制意义的质疑。
今年5月,在台北Computex大会上,他直言出口管制“是失败的”——英伟达在中国的市场份额已从几年前的95%降至约50%,许多中国客户转向国产替代方案,出口管制反而给了中国加速发展的动力。
从财报上也能看出反反复复的芯片禁令对英伟达中国市场表现的损害。英伟达5月发布的2026财年第一财季(覆盖2025年1月29日至4月28日)财报显示,英伟达季度总收入达到441亿美元,中国市场贡献55亿美元。对比三年前ChatGPT发布前的英伟达季度财报,中国市场的收入无疑是大幅增长的,但占比已经从20%以上降到13%。
有意思的是,年初DeepSeek已经给英伟达带来了一次舆论危机,如今很巧合地再次给了当头一棒。
就在H20停产传闻之前,DeepSeek发布了新模型V3.1,使用了UE8M0 FP8 Scale 的参数精度,官方在微信公众号置顶评论称:“UE8M0 FP8是针对即将发布的下一代国产芯片设计。”
国内包括华为、寒武纪在内多家厂商的新一代AI芯片都可以支持 FP8 格式,国产芯片企业暴涨,如寒武纪盘中大涨近14%,半导体ETF在半天的时间里大涨5.89%。
这恰恰印证了他曾多次强调的观点,英伟达并非不可替代不可动摇的,中国市场不会一直等着英伟达被松绑。
8月中旬的时候,路透社就曾报道英伟达正在研发新的中国AI芯片,代号B30A:基于Blackwell架构,性能优于H20,但仍符合出口管制,最快可能在9月提供测试样片。
尤其值得注意的是,今年4月的禁令非常特殊,它特别针对H20,基本上就是在说“H20不能卖给中国”。而美国在此之前的禁令,则是在技术规格等方面做文章,将英伟达的某些芯片囊括其中。
逻辑彻底被改变了,从前英伟达在和美国政府玩的是“猫鼠游戏”,是你制定规则,我努力绕开规则。但当禁令可以直接指向某款芯片,这样的“猫鼠游戏”究竟该怎么玩下去?
再加上中国也开始质疑英伟达“中国”芯片的安全性,英伟达的处境从努力对抗一方,变为了要两头周旋。
英伟达“中国”芯片的不确定性,在这一个多月的时间里,从很高升级为了极高。而这种不确定性,不仅影响英伟达,也影响中国客户对其的信心,以及供应链企业的计划与产能分配。