木白's 技术小屋

木白's 技术小屋, 专注于大模型Infra & 分布式通信

  • 博客
  • 关于
  • 订阅
  • 搜索
  • NCCL (3)
  • Source Code Diagram (3)
  • CUDA (4)
  • Distribute (3)
  • Intra Node (1)
  • GPU (1)
  • TOPO (1)
  • AI Infra (6)
  • Basic (1)
  • Memory Optimization (3)
  • DeepSpeed (2)
  • Training (5)
  • Inference (2)
  • Transformer (5)
  • Mixed Precision (1)

混合精度训练

Apr 16, 2025

随着模型规模的增大, 以及GPU低精度算力的提升, 混合精度训练存在诸多优势, 成为业界标配; 常见的有FP32/BF16混合精度, 最近一年来, FP8混合精度也逐渐流行开来


© 木白 2024 - 2025