AMDROCm6.0源代码现已发布支持InstinctMI300 Radeon7000GPU AI添加
AMDROCm6.0源代码现已发布:支持InstinctMI300、Radeon7000GPU、AI附加功能1
AMD的ROCm6.0软件堆栈和完整源代码现已可供下载和下载。配备InstinctMI300和Radeon7000GPU支持。
AMD的ROCm6.0软件堆栈现支持更多AI库,解锁PyTorch的FP8性能,添加InstinctMI300和InstinctMI300。Radeon7000GPU支持
在公司的AdvancingAI活动中,AMD透露了通过“增强公司ROCm平台”的计划“更新”框架,并处于初始阶段,已在Linux上发布。
ROCm6.0是AMD为与NVIDIA的CUDA进行激烈竞争而做出的尝试。新的软件堆栈不仅升级为支持AMD最新的InstinctMI300GPU,而且还获得了对强大新功能的支持,这是使其成为CUDA平台可行替代方案的一步。
从ROCm6.0带来的功能开始,它支持AMD的InstinctMI300A/MIX300XAI加速器,这些加速器在AdvancingAI活动中再次展示。随着时间的推移,软件堆栈已经有了很大的改进,ROCm平台内的改进进一步提高了AMDInstinctGPU的性能结果,尤其是新版本。然而,Phoronix透露ROCm6.0目前不支持RedHatEnterpriseLinux9中的新InstinctGPU,但最终它将获得支持稍后。
ROCm6.0堆栈的一些主要功能包括:
扩展支持和访问:支持AMDInstinctMI300A和MI300X
人工智能支持的关键功能:高度优化的注意力算法和经过验证的集体通信库
优化的性能:PyTorch和hipblasLT中的FP8支持
帮助开发人员取得成功:预打包的HPC和AI/ML框架可供在AMDInfinityHub上下载;简化和改进的工具
轻松访问资源:新的和改进的ROCm文档以及AMDROCm开发人员中心上所有其他开发人员资源的新主页
接下来是更有趣的部分,ROCm6.0获得了对其他库的支持,例如DeepSpeed、ONNX-RT、Jax和CuPy,这些库在AI实施方面为消费者提供了更大的灵活性。此外,ROCm6.0现在将支持PyTorch和hipblasLT的FP8性能,这不仅可以提供增强的性能,而且可以通过各自的RDNA/CDNA架构为AI工作负载做出实际贡献。
AMD官方表示,ROCm6.0在大型语言模型训练方面已达到与CUDA相当的软件水平,这表明TeamRed在以AI为中心的软件资源方面已经能够缩小差距,而这正是NVIDIA所擅长的领域近年来一直占据主导地位。凭借Linux中对ROCm6.0的支持,用户现在可以下载完整的源代码,可在此处公开获取,您还可以找到受支持的Radeon的完整列表下面列表中的7000和InstinctGPU: