随着AI大模型席卷全球,掌握着算力的黄仁勋和英伟达意外成为最大赢家。
文|投资界PEdaily
黄仁勋如约现身。
在今天(5月29日)举办的COMPUTEX 2023台北国际电脑展上,英伟达创始人黄仁勋身着标志性皮衣,出现在了演讲台上。
这一次,他又带来了多个重磅“炸弹”,其中为引人注目的,是被他称作“巨型GPU”的GH200芯片。
从1993年正式创立英伟达开始,黄仁勋就一直坚守GPU阵地,与英伟达共同经历了跌宕起伏的30年,如今成为了全球GPU市场的统治者,市值更是一举飙到9600亿美元,即将跻身万亿美元市值俱乐部。
随着AI大模型席卷全球,掌握着算力的黄仁勋和英伟达意外成为最大赢家。
黄仁勋又带来了什么?
具体来看,GH200超级芯片是英伟达开发的基于 Arm 架构的CPU+GPU集成方案,它将72核的 Grace CPU、Hopper GPU、96GB的HBM3和512GB的LPDDR5X 集成在同一个封装中,共有 2000 亿个晶体管。
而DGX GH200超级计算机则集成最多达256个GH200芯片,配备多达144TB的共享内存,约为DGX A100超算320GB内存的500倍,可让开发者更好地开发聊天机器人、互联网推荐系统算法等大模型AI应用。据悉谷歌、Meta和微软巨头将率先尝鲜。
图源:今天演讲直播截图
此外,英伟达还将提供一项游戏定制人工智能模型代工服务,即Avatar Cloud Engine (ACE) for Games。该服务可以用来在软件和游戏中构建和部署定制的语音、对话和动画AI模型。黄仁勋介绍,借助大语言模型,游戏中NPC输入背景故事等必要资料,即可实时与玩家产生互动,产生符合逻辑的语言对话、表情等,增强游戏沉浸感。
“这就是未来游戏的样子。”他说。
黄仁勋在演讲中称,“大模型的普及仍然不够,企业需要为特定的业务使用定制大模型,我们得帮助产业利用到大模型”。
而前几天,英伟达刚刚交出的一份亮眼财报,黄仁勋在台上底气十足。
截至2023年4月30日,英伟达2024财年第一季度收入为 71.9 亿美元,虽然较去年同期下降 13%,但好于市场预期的65亿美元,且较上一季度增长 19%。其中,数据中心取代游戏成为英伟达最大的收入来源,占比近六成,而此前游戏一直占英伟达总营收超过一半。
图源:英伟达官方截图
财报显示,英伟达数据中心业务第一季度收入为42.8亿美元,创下了历史纪录,与上年同期相比增长14%,与上一财季相比增长18%。对此,英伟达解释道,数据中心部门的营收增长是由大型消费者互联网公司和云服务提供商的强劲需求推动的。
黄仁勋强调英伟达已做好了准备,“NVIDIA 数据中心全系列产品—— H100、Grace CPU、Grace Hopper 超级芯片、NVLink、Quantum 400 InfiniBand 和 BlueField-3 DPU均已投产。我们正在大幅增加供应,以满足对这些产品激增的需求。”
值得一提的是,英伟达对第二季度的收入展望为110亿美元,要比市场预期的71.8亿美元高出53%,这让一众华尔街分析师为之惊叹。有分析师在报告中写道,“对于任何称这一切是人工智能泡沫的投资者,我们都会向他们展示英伟达这一季度的业绩数据,尤其是对第二财季的业绩指引,这巩固了我们对人工智能的看涨观点,以及即将由人工智能开启的第四次工业革命言论。”
相应地,英伟达在5月25日单日暴涨24.37%,并且涨势在26日仍未停止,短短两天就大涨2000多亿美元,最新市值来到9631亿美元,逼近万亿美元大关,稳坐全球市值最高半导体公司宝座。
回想1999年1月22日,英伟达正式上市,当时市值只有约6.26亿美元,至今暴涨了1500多倍。
黄仁勋何以执掌这艘芯片航母?
祖籍浙江省青田县,黄仁勋1963年出生于中国台湾,1984年从美国俄勒冈州立大学毕业后,便怀揣梦想直奔硅谷,他先后任职于AMD以及LSI Logic,为日后的创业打下了坚定的基础。
1993年,30岁的黄仁勋和另外两个合伙人联合创立了NVIDIA英伟达,立志于图形芯片市场。在最新的演讲中,他回忆起人生曾经历的三次失败,“很多都几乎使我们走向了灭亡。”
第一次失败发生在英伟达创立初期,当时他们与日本游戏大厂世嘉合作开发芯片,没想到一年后微软开发出了Windows 95上的Direct3D图形接口,使得英伟达和世嘉联合开发的技术偏离市场主流。
此时若世嘉选择退出合作且不付款,英伟达将面临倒闭命运。幸运的是,世嘉同意继续付款,为英伟达换来了数个月的喘息时间,从而打造出RIVA 128芯片,扭转了公司的命运。“让我惊讶的是世嘉答应了,也因为他们的慷慨,让我们能再活6个月。”黄仁勋曾回忆道。
1997年,英伟达推出第三代产品Riva 128,不但支持新的行业标准,速度更是竞品的4倍。Riva 128也不负众望地获得了市场认可,上市四个月便卖出了100万片。1999年底,黄仁勋又出人意料地推出全新架构的显示芯片,即GeForce256,率先将显示芯片业带入GPU 时代。
第二次失败是在2007年,黄仁勋决定把CUDA内置入公司的所有GPU中,这是由英伟达打造的一个并行计算平台,包含一系列的开发工具。但 CUDA 的成本非常高,而英伟达当时的市值仅仅维持在10亿美元上下,这让股东们对 CUDA 持怀疑态度。
但黄仁勋相信加速运算的时代将会到来,他创建了一个名为GTC 的会议,并在全球不辞辛劳的推广CUDA技术。直到2014年,一位学者把CUDA用于AI计算,开启了AI时代,CUDA才得以顺利打开市场。“幸运的是,我们也意识到了深度学习的潜力,并冒着一切风险去探索。”
第三次失败则是在2010年,英伟达目睹智能手机崛起,因此进入了手机市场,学习如何开发基带芯片,而英伟达的竞争对手们也同时涌入赛道,研发制造移动计算芯片,让市场竞争变得尤为激烈。为此,英伟达决定放弃手机市场,“因为英伟达的使命是造出能解决‘普通电脑无法解决的问题’的电脑,我们应该专注在这一愿景上,发挥我们独特贡献。”黄仁勋表示。
时间证明这次选择是正确的。虽然放弃了手机,但英伟达却创造了一个新的市场——机器人技术,拥有神经网路处理器和运行 AI 算法的安全架构,并获得了巨大的回报。
对此,黄仁勋曾反思,战略性的撤退、牺牲、放弃才是成功的核心,并且非常关键。
回顾英伟达的创业之路,正是一次次失败,才让这艘巨型航母最终成型。尽管英伟达的股价曾一度跌倒只有6美元,但黄仁勋却一直坚守GPU市场,他也经常以“记住,公司距离倒闭只有30天”这样的话来勉励员工。
虽然英伟达未能成功收购ARM,让黄仁勋感到颇为遗憾,但丝毫不影响他的身价暴涨至330亿美元,约合人民币2330亿元。毫无疑问,在这个AI大爆炸的年代,60岁的黄仁勋正在成为全球科技圈最有权势的男人。
英伟达火爆背后,关于GPU芯片的疯狂一幕正在上演。
众所周知,OpenAI在今年引爆了AI大模型赛道,而每一个AI大模型背后,都需要巨量算力的支撑,这恰恰离不开英伟达。黄仁勋曾透露,在2016年,正是他本人向OpenAI亲手交付了第一台DGX超级计算机,此后成为ChatGPT背后大型语言模型的引擎。
换言之,OpenAI开发的GPT-3.5模型是在搭载英伟达A100芯片的计算系统上训练而来。TrendForce研究推测,以A100的算力为基础,GPT-3.5大模型需要高达2万枚GPU,未来商业化后可能需要超过3万枚。
显而易见,一家AI大模型公司拥有多少枚GPU,将是成败的关键因素之一。而英伟达毫无疑问是这场AI革命中最大的赢家,这也是股价接连飙涨的重要原因。数据显示,英伟达2022年全年PC GPU出货量达3034万块,是AMD的近4.5倍;截至2022年四季度,在独立GPU市场,英伟达占据84%的市场份额。
今年4月初,特斯拉CEO马斯克创建了一家AI大模型公司X.AI,并果断买下一万张GPU,他当时更是语出惊人,表示“就连狗都在抢GPU”。尽管这一比喻可能并不恰当,但却是当下GPU市场的生动写照。
据一份此前流出的《阿里AI专家交流纪要》透露,阿里是国内AI算力储备最多的企业,此后依次为字节、百度、腾讯。而百度也在年初紧急下单3000台8张芯片的A800服务器,也就是2.4万张A800芯片,预计全年会有5万片需求。阿里云则预计在今年需要1万张左右,其中6000张是H800芯片。
所以我们看到,这几年国内创投圈最火爆的融资赛道便是GPU。
“投出我们自己的英伟达”,这是无数风险投资人孜孜奋斗的梦想。不少已经实现财富自由的技术大牛投身于此,众多投资机构顶着“人傻钱多”的压力也要毅然出手,原因无非是这一芯片赛道实在太重要,我们迫切需要拥有自己的一席之地。
这是一场艰难且无法缺席的征途。