GLM-5.2本地化部署新突破:744B模型2-bit量化,Mac Studio上实现低成本私有推理