英伟达周二宣布了其先进人工智能芯片的新配置,旨在加速生成人工智能应用程序。
新版本的Grace Hopper Superchip提高了高带宽内存的数量,这将使该设计能够为更大的人工智能模型提供动力,据Nvidia的超大规模和HPC副总裁Ian Buck称。该配置经过优化,可执行人工智能推理功能,从而有效地为 ChatGPT 等生成人工智能应用程序提供支持。
Nvidia的Grace Hopper Superchip设计将该公司的H100图形处理单元之一与Nvidia设计的中央处理器结合在一起。
“拥有更大的内存允许,允许模型驻留在单个GPU上,并且必须需要多个系统或多个GPU才能运行,”巴克在与记者的电话会议上说。
为能够生成类似人类的文本和图像的生成式人工智能应用程序提供支持的基础人工智能模型的规模继续增长。随着模型尺寸的增加,它们需要更大的内存才能在不连接单独的芯片和系统的情况下运行,这会降低性能。
“额外的内存,它只是简单地提高了GPU的性能,”巴克说。
Buck说,名为GH200的新配置将于明年第二季度上市。
英伟达计划销售两种口味:一种版本包括两个客户可以集成到系统中的芯片,以及一个结合了两种Grace Hopper设计的完整服务器系统。