H800 Tensor Core GPU

PCIe版本SXM版本都是在双精度(FP64)和nvlink传输速率的削减,其他其他参数和H100都是一模一样的。FP64上的削弱主要影响的是H800在科学计算,流体计算有限元分析等超算领域的应用,深度学习等应用主要看单精度的浮点性能,大部分场景下性能不受影响。而受到影响较大的还是NVlink上的削减,但是因为架构上的升级比A800还是要强上不少。
​H800-GPU 可为大模型训练、自动驾驶,深度学习等提供高性能、高带宽和低延迟的集群算例。在面对万亿参数的 AI 大模型训练时,之前需要时间为 11 天,而在 H800 的加持下,新一代集群,训练时间可缩短至 4 天,证明了最新代 H800 比 A800 的高性能,在任务处理上以最快速度处理,进一步证明了,H800 在大模型训练领域有充分的地位以及能力。
产品详情

H800-GPU 可为大模型训练、自动驾驶,深度学习等提供高性能、高带宽和低延迟的集群算例。在面对万亿参数的 AI 大模型训练时,之前需要时间为 11 天,而在 H800 的加持下,新一代集群,训练时间可缩短至 4 天,证明了最新代 H800 比 A800 的高性能,在任务处理上以最快速度处理,进一步证明了,H800 在大模型训练领域有充分的地位以及能力。

image.png