大语言模型 think budgetAI infer十月 26, 2025我不知道有多少人在使用思考模型,但笔者个人对思考模型的推理性能(性能吞吐)是极度不满意的,因此笔者一直避免使用思考模型,但人在江湖身不由己,有时候不得不使用思考模型。从OpenAI开始提出推理模型开始,思考模型已经逐渐成为了学界和业界的热点,国内开源模型两巨头qwen和deepseek,都有思考模式LLM servingsglang