英伟达选择甲骨文 OCI 云技术提供大规模 AI 超级计算服务 NVIDIA DGX Cloud 焦点滚动
发布时间:2023-03-28 16:54:13 文章来源:IT之家
当前位置: 主页 > 资讯 > 国内 > 正文


(资料图)

3月28日消息,甲骨文宣布与英伟达(NVIDIA)进一步扩大合作,在全新的Oracle云基础设施远程软件服务(注:全称Oracle Cloud Infrastructure,简称OCI)Supercluster上运行战略性NVIDIA AI应用。英伟达选择OCI作为该企业的超大规模云技术提供商,提供大规模的AI超级计算服务NVIDIA DGX Cloud。此外,英伟达正在运行其生成式AI云服务NVIDIA AI Foundations,该服务通过基于OCI的DGX Cloud提供。

NVIDIA DGX Cloud和在基于其运行的NVIDIA AI Foundations服务利用英伟达认证的OCI Supercluster来确保其符合DGX Cloud的高标准。

OCI Supercluster包含了OCI Compute Bare Metal、基于NVIDIA网络的超低延迟RoCE集群,以及HPC存储的选件。英伟达已部署并验证该超级集群,以支持数千个OCI Compute Bare Metal实例高效处理大规模并行应用。OCI Supercluster网络现在可以使用32,768个A100GPU,扩展至4,096个OCI Compute Bare Metal实例。现在,配备NVIDIA H100GPU的OCI Compute Bare Metal实例已限量供应。

此外,英伟达宣布,甲骨文公司正在将NVIDIA BlueField-3DPU添加到其网络堆栈中。

NVIDIA AI Foundations建模服务涵盖语言、图像、视频和3D以及生物学。企业可以使用NVIDIA NeMo语言服务和NVIDIA Picasso图像、视频和3D服务,构建专有的、特定领域的生成式AI应用,从而实现智能聊天和客户支持、专业内容创建、数字模拟等。对于生物AI模型训练和推断,NVIDIA BioNeMo云服务提供了用于快速定制和部署生成式AI应用的工具。

在 OCI上,使用NVIDIA AI Foundations的定制模型和像GPT-3一样的模型系列可从OCI Supercluster中受益,其中包括专门构建的RDMA网络。该网络可提供近线速的性能和微秒延迟,并消除有关依赖RDMA的工作负载的障碍。

标签:

最近更新