1.Ollama 启动参数设置

Ollama 从 2025 年中开始支持 thinking 参数,直接用 flag 控制:

ollama run qwen3.5 --think=false

或者:

ollama run qwen3.5 --hidethinking

隐藏思考但内部仍思考!

这是 Ollama 官方提供的支持,不仅限于 Qwen 3.5,也同样适合其他具有思考能力的模型。

2.Ollama 对话中进行切换

关闭思考:

/set nothink

启动思考:

/set think

一旦输入成功之后,后续对话,就会按设置的模式来执行了。

LM Studio 在My Models -> 当前模型 -> Inference -> 提示语 第一行添加

 {%- set enable_thinking = false %}

Ollama API中关闭思考

payload = {
        "model": model,
        "messages": messages,
        "stream": True,  # 启用流式输出
        "think": enable_think  # Ollama 原生协议:控制模型是否进行思考
    }

必须是think,后面可以跟True或者False!