首页
avatar

WingEdge777

一文理解 PyTorch 进行分布式应用开发 - 分布式推理入门实战

一文理解 PyTorch 进行分布式应用开发 - 分布式推理入门实战

code

如今模型越来越大。当模型参数量达到数百亿级别,即使通过INT4量化压到单卡能装下权重,推理时的KVCache和激活值也会随batchsize和序列长度线性增长,单卡显存很快捉襟见肘——多卡分布式推理几乎是必经之路。#使用PyTorch进行分布式应用开发-分布式推理入门实战但想直接阅读Megatron

1 2 3