LLM显存占用计算器

计算公式:

\[ M = \frac{P \times Q \times 10^9}{8 \times (1024)^3} \times 1.2 \]

符号 描述 (中/英)
M GPU 显存需求 (GB) / GPU memory required (GB)
P 模型参数量 (十亿) / Number of parameters (B)
Q 数值精度 (比特数) / Precision (bits)

数值精度选项说明:

注:公式中的 1.2 系数表示额外 20% 的显存开销,是一个大体的预估值。

返回 WMW