英伟达:从为“玩物丧志”添油加醋到为AI开山铺路
第一财经第一财经官方账号04.2415:33
(本文作者李伟,长江商学院亚洲市场副院长、经济学教授)
“英伟达”,曾经在PC游戏界颇有知名度,也因此在不少国人眼里是个不太正经的存在;在今天它已然“脱胎换骨”成为了推动当下AI(Artificial intelligence,简称AI)革命的最强引擎,甚至微软、Alphabet(谷歌母公司)、(Facebook母公司)、亚马逊、等科技巨头也纷纷以自己拥有的海量英伟达H100芯片为荣。
起家靠“玩物丧志”的游戏显卡生意,英伟达不断“打怪升级”,练就了自己在算力上强大的护城河,并在AI浪潮等风口来临之际,实现了从爱理不理到高攀不起的“华丽转身”。
2024年开局,“英伟达(Nvidia)神话”被推向新高潮:随着创纪录的年报业绩发布,市场情绪一路高涨。
3月7日,英伟达股价首次突破900美元大关,总市值达到2.32万亿美元,全球排名第三,仅次于微软和苹果,短短两个多月的时间上涨幅度超过87%。这即使在擅长快速增长的高科技股中也是种“奇迹”!
更重要的是,英伟达似乎铁了心,要将商业上的领先优势加速扩大。
1月18日,Meta的CEO马克·扎克伯格宣布,到2024年年底,Meta 将从英伟达购买 35 万张 H100 显卡作为其正在建立的“大规模计算基础设施”的硬件支持(保守估计这将为英伟达贡献超过 90 亿美元收入)。
3月18日,英伟达年度GTC技术大会【GPU(Graphics Processing Unit,图形处理器,简称GPU)Technology Conference】又再扔重磅炸弹,发布了包括AI算力提升30倍的新一代AI芯片架构Blackwell、人形机器人通用基础模型、新一代集中式车载计算平台Thor等新品,并扩大了与比亚迪、小鹏和广汽埃安等中国车企的合作;同时扩大英伟达AI技术的应用范围,加速其在药物研发等领域的应用等等。
如今英伟达的市场地位如日中天:在人工智能领域,英伟达是不可望其项背的存在;在资本市场中,英伟达更是神一般的存在。
作为一家成立于1993年的公司,英伟达过去的主要业务是游戏显卡,喜欢打游戏的人大多都知道它,随着其在GPU领域的不断“打怪升级”,加上连续的算力风口,英伟达近年来彻底破圈,摇身一变成为“AI的世界引擎”、全球的宠儿。
英伟达如何实现这样的突破?又是如何连续加筑护城河,让自己的领先优势不断扩大的呢?
01
英伟达前传
今天我们看到的英伟达风光无限,似乎就是为这个时代而生,但实际上其发展历程中却经历了不少大风大浪,好几次甚至命悬一线。
故事的“大男主”是被称为“皮衣黄”(因爱穿皮衣而得名)的黄仁勋(Jensen Huang),他现在的身份是美国工程院院士、英伟达创始人兼CEO。
1963年黄仁勋出生于中国台湾省台南市,9岁赴美求学,16岁进入俄勒冈州立大学,主修电子工程专业。大学毕业后他在知名芯片公司超威半导体公司(Advanced Micro Devices,简称)任职芯片工程师,并拿到了斯坦福大学的硕士学位。
此后他加入硅谷大佬威尔弗雷德·科里根(Wilfred Corrigan)创办的艾萨股份有限公司(Large Scale Integration,大规模集成电路公司,简称LSI),先后从事图形处理硬件开发以及硬件销售的工作,并在后期成为了LSI的董事。
1993年初,黄仁勋与两位好友、在硅谷摸爬滚打十余年的芯片设计师克里斯·马拉科夫斯基(Chris Malachowsky)和柯蒂斯·普里姆(Curtis Priem)一致看好图形处理的未来前景,他们共同创立了英伟达,专注于开发独立显卡。
显卡专门用于处理计算机上的图形和视频输出,主要功能是将图形数据转换为可以在显示器上显示的图像。显卡的类型包括集成在主板上的集成显卡和作为独立扩展卡的独立显卡,核心组件是GPU,主要负责执行图形渲染所需的复杂数学计算。
在当时,显卡以集成显卡为主,但3D(Three Dimensions,三维,简称3D)图形处理非常消耗算力,而一般的集成显卡显示效果不佳,市场对能专门处理图形的独立显卡需求很大,其中需求最大的当数游戏。
这里简要解释一下GPU与中央处理器(Central Processing Unit,简称CPU)的区别,以及为什么GPU较之CPU具有更强的算力。
CPU是一种通用处理器,作为计算机的主核心,它的任务非常复杂,既要应对不同类型的数据计算,还要响应人机交互。
在CPU中缓存单元大概占50%,控制单元25%,运算单元25%。CPU的强项是管理和调度,算力不是它的优势。
GPU恰恰相反,它为图形处理而生,任务非常明确且单一,就是做图形渲染。图形由海量像素点组成的,属于类型高度统一、相互无依赖的大规模数据。
GPU的任务是在最短的时间里,完成大量同质化数据的并行运算,调度和协调之类的“杂活”很少。在GPU中缓存单元大概占5%,控制单元5%,运算单元则高达90%。
可以说GPU就是天然为大规模计算而生的。
上世纪90年代正是全球电子游戏兴起的时代,个人电脑(Personal Computer,简称PC)开始进入家庭,这激发了大量的娱乐需求,但2D游戏市场并不大。
黄仁勋认为3D游戏有望全面突破2D游戏的发展瓶颈,并预测其将成为世界上最大的行业之一。但刚起步的3D游戏,受制于CPU算力,人和物都显示得很模糊,视觉效果非常差,亟需功能更强大的独立显卡做3D渲染。
当时市场上已经有20到30家与英伟达类似的公司了,并且在随后两年里增长到90多家,整个行业没有什么软硬件标准,处于一片混战的状态中。
英伟达出师不利。
尽管在前老板的引荐下,黄仁勋很快获得了红杉资本领投的2000万美元融资,但直到公司成立两年后才推出第一款产品NV1显卡,更糟糕的是因为押错技术路线以及系统兼容性等原因,这款产品推出后市场反应不佳。
不幸中的万幸,1995年日本游戏巨头世嘉伸出了橄榄枝,希望英伟达为其即将推出的游戏机“土星”(SEGA Saturn)研发一款芯片,定价700万美元。
之后,英伟达虽然在世嘉的帮助下涉险过关,但其第二代产品NV2的开发依然不顺利,不久就胎死腹中。
到了1997年英伟达已经危在旦夕,公司从上100人裁员到大概30人,账面只剩6个月的运营资金。
黄仁勋意识到,此刻最重要的就是活下去。他紧急停掉原先的项目,将英伟达的战略从游戏主机转向PC市场,并从游戏设计公司晶体动力(Crystal Dynamics)请来大卫·科克(David Kirk)博士担任首席科学家,组建新的研发团队,同时抱紧微软的大腿,推出完全兼容微软Direct 3D显示标准的图形处理器RIVA128,这一次黄仁勋终于尝到了胜利的滋味。
不久,黄仁勋就自信满满地公开表示,英伟达将超越摩尔定律(摩尔定律有多个版本,其中最常见的版本为集成电路上可容纳的晶体管数目,约每隔18个月便增加一倍),产品每6个月升级一次!
这一速度相当于摩尔定律的三倍,后来被称为“黄氏法则”(Huang’s law)。
尽管设计出了优秀的显卡芯片,但英伟达作为一家初创公司,很难找到资金自建晶圆厂,那时候建设一个晶圆厂至少需要1亿美元以上,并且耗时很长。
1998年黄仁勋尝试写信向台积电的张忠谋求助,很快张忠谋打来的电话让他激动不已:双方达成协议,将显卡芯片外包给台积电代工。
这意味着英伟达可以专注于芯片设计,而无须过多操心具体的生产环节。
当时芯片代工的模式刚刚兴起不久,不同于和三星等巨头将芯片设计与生产捆绑在一起,这种无晶圆厂的“轻资产”模式将两者分开,更有利于专业化的分工,以及让更多擅长芯片设计的参与者加入。
对此,黄仁勋曾表示,“没有张忠谋就没有英伟达,没有他所创立的台积电,就没有英伟达今天的成就。”
1999年1月英伟达成功登陆纳斯达克。
上市后英伟达继续践行“黄氏法则”,于当年9月推出GeForce256这一跨时代的产品,被誉为“世界上第一块真正意义上的GPU”,然而就在此时,英伟达的第二次危机又悄然降临了。
2000年,微软准备推出Xbox,大举进军游戏机市场,要与索尼、任天堂、世嘉一较高下。显示芯片的好坏直接决定着游戏效果,进而影响到游戏机厂商的成败。
鉴于与英伟达长期的合作关系,微软很快宣布Xbox将采用英伟达的显示芯片,并直接支付了2亿美元定金,总合同金额达到5亿美元,当时英伟达全年的销售额也不过5亿美元。
没想到,2002年1月微软Xbox正式上市后并不如预期中受欢迎,也不如索尼的游戏机有竞争力。微软开始调低Xbox的价格,意图通过价格战扳回一局,微软希望英伟达也能调低显卡的价格,结果遭到了黄仁勋的坚决拒绝,微软一怒之下把英伟达踢出了局,并找到了英伟达的死对头冶天科技(Array Technology Industry,简称ATI),将Xbox二代订单送给了ATI。
此后,英伟达在竞争中节节败退,在2002年股价一路下滑,从每股70美元下滑到只有7美元,市值从110亿美元缩水到10亿美元。2002年底,一向骄傲的黄仁勋彻底认清了英伟达的严峻形势,他公开承认战略失误,并开始奋力突围,在经过了一系列努力之后,2003年终于带领英伟达重振旗鼓。
02
进军人工智能
从2004年到2007年,英伟达度过了顺风顺水的四年,主攻的游戏和专业绘图处理器业务稳步增长。
在此期间,黄仁勋还有一个对英伟达的未来影响深远的重大发现:他发现斯坦福大学博士生伊恩·巴克(Ian Buck,简称巴克)领导的研究团队发布了编程模型Brook,可以用C语言编程让GPU进行计算。
巴克的发现意味着人们可以挖掘GPU的更大潜力,不仅局限于图形渲染上,也适用于非图形的大量计算。黄仁勋迅速将巴克挖到英伟达工作,并委以重任。
在巴克率领下,英伟达于2006年正式推出——统一计算架构(Compute Unified Device Architecture,简称CUDA),这是全球首款GPU上的通用计算解决方案,也是一个非常了不起的突破。
“谷歌大脑之父”吴恩达曾评价说,“在CUDA出现之前,全球能用GPU编程的人数极少(据说不超过百人),而CUDA的出现使得使用GPU变得轻松”。
CUDA出现后,一个计算机专业的大学生稍加培训,就可以为GPU编程,极大地推动了GPU编程的普及和发展。
于是英伟达投入了至少100亿美元和大量人力,让英伟达几乎所有的显卡全都可以支持CUDA。
此后,经过英伟达的积极推广和一系列努力,GPU变成了真正意义上的通用图形处理器(General-Purpose GPU,简称GPGPU),应用领域从3D图像处理扩大到了加速计算领域,像量化金融、航天、能源勘测和天气预报等,这些领域都有英伟达显卡的影子,并且英伟达通过软件CUDA和硬件GPU的结合,形成了自己的护城河。
此时,英伟达已逐步坐稳了自己在GPU行业的头把交椅。
之后,英伟达近十年的投入在2013年后迎来了集中的回报:2013年一个巨大的风口——“挖矿”(生成新的比特币)出现了。
诞生于2008年的比特币,在2013年迎来了第一次大牛市,当年12月比特币价格突破1000美元大关。
比特币爆火带来了大量的挖矿需求,挖矿需要的正是大量并行计算,英伟达因此如鱼得水,一飞冲天。
2015年在挖矿机械催生的需求下,市场对英伟达GPU的需求迎来了爆发式的增长,GPU处于供不应求的状态。
成也萧何,败也萧何。2022年加密货币市场崩塌,再加上游戏端需求萎缩,英伟达的股价暴跌了46%。
幸运的是,很快两个新的风口又降临了——元宇宙和AI。
元宇宙作为一个虚拟的数字空间,它的实现离不开高性能的GPU。英伟达的GeForce、Quadro和系列产品已成为元宇宙建设的关键技术支持。
此外,英伟达还通过推出Omniverse平台,允许创作者、开发者和工程师在一个统一的环境中设计、构建和运行复杂的虚拟世界。这对于元宇宙的发展具有极大的推动作用。
更大的风口来自于人工智能。
2022年11月,沉寂已久的人工智能因为聊天生成预训练转换器(Chat Generative Pre-trained Transformer,简称ChatGPT)的出现而大火。ChatGPT的成功同样需要英伟达的硬件支持。
大模型的训练需要大规模的并行计算,而能实现并行计算的GPU被视为AI的重要原料遭到疯抢。
根据媒体报道,ChatGPT至少导入了1万个英伟达的A100显卡训练,A100显卡的价格一度被炒到上万美元。
2022年,英伟达又推出了A100的升级版H100,性能是A100的4~6倍。
2023年以来,英伟达不满足于单纯卖GPU,它的领域正变得越来越宽:除了前文提到的2024年GTC大会发布的新品外,英伟达还将GPU、数据处理器(Data Processing Unit,简称DPU)和CPU合并,制造出拥有恐怖计算能力的DGX GH200超级计算机、计算平台BlueField-3DPU等。
同时,英伟达也加强了对终端的渗透,对于当前最看好的AI制药、新能源汽车、机器人等应用端,英伟达或通过与战略伙伴深度捆绑合作,或通过亲自下场投资的方式,推动其GPU在这些领域的广泛应用。当前,已经进入“无人区”的英伟达,依然在用自己创造的“黄氏法则”疯狂地卷自己。
03
不断加固护城河的启示
回头来看,英伟达今天能取得如此高的市场地位,有偶然因素,但也是一种必然。偶然之处在于英伟达赶上了一系列算力的风口,站在风口连猪都能飞上天,更何况是强大如斯的英伟达?而必然之处在于,黄仁勋独到的眼光和“长期主义”的精神,他凭借着自己的倔强和坚持,在即使大家都不看好的情况下,为英伟达打造了深深的“护城河”并且不断持续加固着自己的护城河。对于英伟达“护城河”的构建策略,笔者认为以下几个方面值得中国企业思考和借鉴。
第一是确立极高的行业标准并不断践行。如果说“摩尔定律”的提出塑造了集成电路领域的格局,将英尔特公司推向了神坛,那么“黄氏法则”对GPU行业的更新速度和英伟达的全球领导地位则是至关重要的,特别是随着CPU的“摩尔定律”逐渐因接近物理极限而面临失效之际,GPU的“黄氏法则”让对算力如饥似渴的研究者、开发者燃起了更多希望。更重要的是,“黄氏法则”因其超高的更新速度,在技术层面扮演了护城河的角色,提高了行业进入门槛,让许多潜在的参与者望而生畏。
为了践行“黄氏法则”,突破算力的限制,英伟达一直在以更创新的方式努力着,比如随着AI模型和数据规模的增长,单个GPU已经无法满足计算需求,这时候需要通过集群计算来扩展算力,英伟达适时推出了NVLink和NVSwitch技术。
NVLink作为一种高速互联技术,允许多个GPU直接连接,形成一个逻辑上的“超级GPU”;NVSwitch则进一步扩展了这种互联能力,可以将多个服务器中的GPU直接互联,这极大降低了GPU间通信的延迟,提高了数据同步效率。
2023年5月,英伟达发布的DGX GH200超算系统通过NVLink和NVSwitch连接了256块Grace Hooper超级芯片,实现了100亿亿次的AI计算性能,这种超级互联和超级计算的能力使得英伟达在算力上的竞争优势达到了一个新的层面。
第二,持续构建核心生态系统,不断加强生态系统参与者的依赖度,同时利用这些参与者再去影响更多的行业标准。
英伟达在CUDA上持续地高投入,打造出了GPU结合CUDA的生态系统,使得相关市场参与者非常依赖于这个生态系统。
CUDA的出现使得对于GPU的编程变得更为简单,它支持多种编程语言,并且拥有丰富的工具和代码库,兼容多个操作系统。
这些特点使得GPU的应用者逐步从游戏制作人扩展到科学家、工程师和艺术家等多个领域。
面对近年来AI的兴起,英伟达更是针对AI和深度学习领域推出了众多CUDA的加速库,构建了一个强大的软硬件生态系统。
到2023年5月,CUDA注册开发者的数量已增加至400万,成为拥有庞大的社区资源和活跃的开发者社区,英伟达几乎垄断了训练芯片市场。
英伟达还通过与高校合作、建立研究中心和教学中心、推出认证计划等方式,将CUDA引入教育和产业界,扩大其影响力。
同时,英伟达也通过Inception计划支持初创公司,开源了多个通用开发库,并优化了中间件性能的基础库,进一步扩大了其生态系统。
这些举措使得CUDA在消费市场上受到青睐,成为了许多开发者依赖的技术。
那些想要超越英伟达的“后来者”即使能在硬件上实现突破,短期内也很难突破CUDA的软件“封锁”。
第三,英伟达非常善于利用自身优势,构思在竞争对手前面,提前布局未来需求。
这一点从其对CUDA长达十年的投入,踩中比特币、元宇宙以及AI训练等诸多风口中可见一斑,而当下英伟达更是在积极布局AI制药、新能源汽车、人形机器人等未来可能的风口。
最后,笔者想特别指出,英伟达能实现如此绚烂的转型,除了要归功于黄仁勋和其管理团队在关键战略决策上的果断和远见外,也要感谢社会环境对于游戏产业的宽容,只有在更宽容的环境下,才可能产生更多更优秀的创新,造福社会!
英伟达的护城河未来是否将依然牢不可摧?它的领先优势还能保持多久?会不会出现更强王者?
对此,我们可以拭目以待。
(本文作者李伟,长江商学院亚洲市场副院长、经济学教授)