“RuntimeError: makeDeviceForHostname(): unsupported gloo device”

10次阅读
没有评论

gloo作为PyTorch 中用CPU 进行分布式训练时,的默认后端问题波及torch >=2.8 ,<2.10

受影响的有vllm-windows,deepspeed-windows,等依赖分布式训练的库

正文完
 0
评论(没有评论)