人类历史上最科幻的一场发布会——黄仁勋

【金色港湾资讯网为您推荐阅读】

人类历史上最科幻的一场发布会——黄仁勋(图1)

当天下午黄仁勋上台开始讲话,但这一次与以往不同。 发布会在SAP中心举行。 人们要排100米长的队伍,经过检票、等待两个小时,转了好几圈才进入讲堂。 这里是硅谷多场音乐会和表演的场地,占地42000平方米。 它曾举办过滚石乐队和 Bon Jovi 音乐会以及美国 NHL 全明星赛。 现在站在舞台中央的是黄仁勋。 他让很多人到场。 开发人员想到了史蒂夫·乔布斯。

人类历史上最科幻的一场发布会——黄仁勋(图2)

预演结束后,黄仁勋上台。 背景停留在“我是AI”界面。

人类历史上最科幻的一场发布会——黄仁勋(图3)

“我希望大家认识到,这不是一场音乐会,你们来的是一场开发者大会。” 黄仁勋说道。 这是一场只有模拟、没有动画的会议。 他说。 这也让整个发布会看起来越来越像一部科幻电影。 可能是人类历史上最科幻的新闻发布会。

“今天到达GTC的公司价值1。有这么多合作伙伴,需要这么多计算能力。我们该怎么办?我们需要更大的GPU。连接所有GPU,有数千个大型GPU。数千个小GPU,数百万个GPU可以提高你的效率!”

人类历史上最科幻的一场发布会——黄仁勋(图4)

然后他简单回顾了人工智能的发展历史,“我们在20年前就看到了它的到来。”

人类历史上最科幻的一场发布会——黄仁勋(图5)

“随后CUDA与AI进行了第一次亲密接触。” 他说。 “当 CUDA 在 2006 年推出时,我们认为它是革命性的,会一夜成名,但我们最终等了 20 年!”

人类历史上最科幻的一场发布会——黄仁勋(图6)

“一切都是今天。” 在 AI 模拟出每个炫酷视频后,一切都已准备就绪 - 是这一切进步的基石。 是时候发布重要的芯片了。

人类历史上最科幻的一场发布会——黄仁勋(图7)

人们早料到了这一点,但当B200出现时,观众(或许包括全世界的围观者)不禁发出惊呼。

这是最新一代的架构,以数学家的名字命名。 就表演而言,它是黄仁勋“黄氏定律”的集大成者和创始人。

以下是我用AI总结的GPU的性能特点:

高人工智能性能:B200 GPU 由 2080 亿个晶体管提供高达 FP4 20% 的计算能力。

高效推理:与Grace CPU结合形成GB200超级芯片时,它在LLM推理工作负载上的性能比单个GPU高30倍,同时成本和能效比H100 GPU高25倍。

训练能力:使用GPU,训练1.8万亿参数模型所需的GPU数量从8000个减少到2000个,功耗从15兆瓦减少到仅4兆瓦。

人类历史上最科幻的一场发布会——黄仁勋(图8)

GPT-3 性能:在 GPT-3 LLM 基准测试中,GB200 的性能比 H100 好七倍,训练速度快四倍。

改进的引擎:第二代引擎通过每个神经元使用四位而不是八位,使计算、带宽和模型大小加倍。

下一代交换机:允许最多 576 个 GPU 之间进行通信,提供每秒 1.8 太比特的双向带宽。

新型网络交换芯片:拥有500亿个晶体管,3.6FP8算力,用于支持大规模GPU集群的通信。

可扩展性:系统可通过-X800或-X800以太网连接扩展到数万个GB200超级芯片。

人类历史上最科幻的一场发布会——黄仁勋(图9)

大规模部署:GB200 NVL72设计可将36个CPU和72个GPU集成到液冷机架中,总共提供720的AI训练性能或1.4的推理性能。

支持大型模型:单个NVL72机架最多可支持27万亿个参数的模型,而且有趣的是,黄仁勋似乎透露了GPT-4的参数,这可能是一个拥有约1.7万亿个参数的模型。

(今天晚些时候我们将带来更多关于B200的解读,请关注 Star GTC的后续报道)

黄仁勋回顾了他赠送的第一个DGX。 原来只有0.0,而今天的DGX Grace-GB200已经有1.0以上的算力了。

人类历史上最科幻的一场发布会——黄仁勋(图10)

老黄站在这张照片前,讲了很久。 这张图让你感觉摩尔定律可能真的死了,黄氏定律正式接替了。

人类历史上最科幻的一场发布会——黄仁勋(图11)

B200发布后,黄仁勋用一段AI生成的模拟短片介绍了从集群到数据中心交换机的一系列“配套”产品。 基本上他们是性能怪物。

GB200超级芯片结合了两个B200 GPU和一个Grace CPU。 与H100相比,可以降低成本和能耗高达25倍。”黄仁勋说,他肯定可以肯定,“这个很贵,也许1001亿吧? 但未来会更便宜。 ”现场爆发出阵阵笑声。

人类历史上最科幻的一场发布会——黄仁勋(图12)

同时,他还强调了新一代芯片及相关产品在能耗方面的改进。 此前,训练 1.8 万亿个参数模型需要 8,000 个 GPU 和 15 兆瓦的功率。 如今,使用 2,000 个 GPU 即可完成同样的任务,而功耗仅为 4 兆瓦。

人类历史上最科幻的一场发布会——黄仁勋(图13)

黄仁勋表示, 还将它们封装成更大的设计,例如 GB200 NVL72,它将 36 个 CPU 和 72 个 GPU 集成到单个液冷机架中,总共提供 720% 的 AI 训练性能或推理性能。 它内部有近两英里长的电缆,其中包括 5,000 根单独的电缆。

人类历史上最科幻的一场发布会——黄仁勋(图14)

此外,他还特别强调了推理能力的提升。 毕竟,英伟达最新的财报显示,其收入越来越多地来自于客户在AI推理方面的支出。 各大云厂商也纷纷点名称赞,越来越离不开。

在软件方面,黄仁勋介绍,正在打包预训练的模型及其附加扩展,并简化称为推理微服务(NIMS)的微服务的部署。 这不仅仅是以前的CUDA,而是一个让模型更容易实现和管理的平台。

人类历史上最科幻的一场发布会——黄仁勋(图15)

“你现在就可以下载它,把它拿走,然后安装在你自己的数据中心,”他说。

人类历史上最科幻的一场发布会——黄仁勋(图5)

并提供服务帮助企业和应用程序微调或定制模型。

人类历史上最科幻的一场发布会——黄仁勋(图17)

在列出了一系列气象和科学领域的合作后,黄开始进入机器人领域,会议开始变得更加科幻。

黄仁勋表示,英伟达押注的下一代产品是能够控制人形机器人。 Thor 是继 Orin 后针对机器人技术推出的新产品。

人类历史上最科幻的一场发布会——黄仁勋(图18)

“确实,世界是为人类而设计的,因此我们希望使用 Thor 芯片和 GR00T 软件来训练和管理新一代人形机器人。 此类机器人将能够更好地适应人类设计的环境和工作流程,从而在多样化的环境中运行。 帮助完成任务和场景。”

人类历史上最科幻的一场发布会——黄仁勋(图19)

机器人演示视频结束后,当舞台灯光重新亮起时,黄先生站在所有公司动力的人形机器人的身后,向观众致意。 不知道为什么有种钢铁侠的感觉~

人类历史上最科幻的一场发布会——黄仁勋(图20)

我们还带来了两个在 Isaac SIM 中学会走路的迪士尼小机器人。 黄仁勋说话的时候它们一直在蠕动,黄仁勋只好低下头,亲昵地低声说道:“(小机器人的名字),我在集中注意力!别再耽误时间了”——超可爱,带动气氛将场面推向新的高潮。

人类历史上最科幻的一场发布会——黄仁勋(图21)

在黄仁勋和两个小机器人一起“开场”的谢幕视频中,一艘微型宇宙飞船飞过前几代GPU产品和架构,完成了一次光缆中的技术之旅。 终于,飞机舱门在不经意间打开,飞行员不是别人,正是黄仁勋笔下的卡通虚拟数码人。

在主题演讲结束前,黄仁勋再次总结了今天的发布会,特写镜头显示黄仁勋似乎泪流满面。

“如果你问我对 GPU 的看法,今天的发布就是我的答案。”

人类历史上最科幻的一场发布会——黄仁勋(图22)

他表示,今天他展示了英伟达的灵魂是什么。 “我们站在计算科学、物理学和所有其他科学的交叉点。” 这就是英伟达在他心目中的定位。

人类历史上最科幻的一场发布会——黄仁勋(图23)

“新工业革命即将来临。” 他没有说出来的,是今天一张PPT上隐藏的一行小字——,新工业革命的引擎。

这是黄仁勋的时代。

人类历史上最科幻的一场发布会——黄仁勋(图24)

海量信息、精准解读,尽在新浪财经APP

顶一下
(0)
0.00%
踩一下
0
0.00%

您可能还会对下面的文章感兴趣: