木白's 技术小屋

木白's 技术小屋, 专注于大模型Infra & 分布式通信

博客
关于
订阅
搜索

NCCL (3)
Source Code Diagram (3)
CUDA (4)
Distribute (3)
Intra Node (1)
GPU (1)
TOPO (1)
AI Infra (6)
Basic (1)
Memory Optimization (3)
DeepSpeed (2)
Training (5)
Inference (2)
Transformer (5)
Mixed Precision (1)

大模型显存占用及优化

随着大模型参数量的不断增长, 显存成为瓶颈, 本文分析了显存占用的类型及大小, 同时讲述了业界提出的多种优化策略

大模型训练并行策略

随着大模型参数量以及训练数据量的不断增长, 显存根本不够用, 另外也为了加速计算, 出现了多种并行策略, 如TP, PP, DP, SP, EP等

© 木白 2024 - 2026