【大規模モデル】Tensor/Pipeline並列化の理論と実装 2026年1月28日 Transformer 大規模言語モデル(LLM)は数十億から数千億のパラメータを持ち、単一のGPUメモ... LLMPipeline並列Tensor並列モデル並列化分散学習深層学習
【PyTorch】分散学習(DDP/FSDP)の仕組みと実装 2025年11月27日 Transformer 分散学習は、複数のGPUやノードを使ってモデルの訓練を並列化する技術です。大規模... DDPFSDP分散学習大規模モデル深層学習