AMD ROCm代码建议在未来的GPU中支持BFloat16

2022-04-03 14:27:31
导读 GitHub最近对AMD开源ROCm软件进行的更新表明,继Google,Intel和Arm的脚步之后,未来的AMD GPU可能会支持日益流行的BFloat16数字格式用于

GitHub最近对AMD开源ROCm软件进行的更新表明,继Google,Intel和Arm的脚步之后,未来的AMD GPU可能会支持日益流行的BFloat16数字格式用于深度学习培训。

GitHub上的更新是对ROCm软件平台存储库中的一项提交,ROCm软件平台存储库是AMD用于GPU计算的开源HPC平台,标题为“更多BF16 TN大小”。对BF16的引用(BFloat16或bfloat16的缩写)表明AMD可以在以下版本中实现它未来GPU架构中的硬件。

BFloat16是Google最近开发的一种数字数据格式,用于深度学习培训,并在其TPU中实现。它会将标准FP32浮点数的尾数截断16位,从而将其精度降低了多个小数位。通过采用16位格式,它需要更少的硅面积和带宽,而且Google还声称,与目前标准化的FP16格式相比,在硬件中实现效率更高。

硬件越来越支持BF16格式。英特尔已经宣布将广泛采用该格式,并在即将推出的Cooper Lake-SPXeon,Agilex FPGA和Nervana NNP-T中提供支持。最近,ARM宣布支持Armv8的BF16。随着AMD现在可能加入该党,这将使Nvidia成为唯一的主要AI硬件供应商,而没有公众支持该格式的承诺。

免责声明:本文由用户上传,如有侵权请联系删除!