LLM显存占用计算器

模型参数量 (B)：

加载精度 (Q)：

计算公式：

\[ M = \frac{P \times Q \times 10^9}{8 \times (1024)^3} \times 1.2 \]

符号	描述 (中/英)
M	GPU 显存需求 (GB) / GPU memory required (GB)
P	模型参数量 (十亿) / Number of parameters (B)
Q	数值精度 (比特数) / Precision (bits)

数值精度选项说明：

注：公式中的 1.2 系数表示额外 20% 的显存开销，是一个大体的预估值。