木白's 技术小屋

木白's 技术小屋, 专注于大模型Infra & 分布式通信

  • 博客
  • 关于
  • 订阅
  • 搜索
  • NCCL (3)
  • Source Code Diagram (3)
  • CUDA (4)
  • Distribute (3)
  • Intra Node (1)
  • GPU (1)
  • TOPO (1)
  • AI Infra (6)
  • Basic (1)
  • Memory Optimization (3)
  • DeepSpeed (2)
  • Training (5)
  • Inference (2)
  • Transformer (5)
  • Mixed Precision (1)

大模型显存占用及优化

May 23, 2025

随着大模型参数量的不断增长, 显存成为瓶颈, 本文分析了显存占用的类型及大小, 同时讲述了业界提出的多种优化策略

大模型训练并行策略

Mar 28, 2025

随着大模型参数量以及训练数据量的不断增长, 显存根本不够用, 另外也为了加速计算, 出现了多种并行策略, 如TP, PP, DP, SP, EP等


© 木白 2024 - 2025