大模型API测试实战:max_tokens、流式输出与性能指标全解析