1.Ollama 启动参数设置
Ollama 从 2025 年中开始支持 thinking 参数,直接用 flag 控制:
ollama run qwen3.5 --think=false或者:
ollama run qwen3.5 --hidethinking隐藏思考但内部仍思考!
这是 Ollama 官方提供的支持,不仅限于 Qwen 3.5,也同样适合其他具有思考能力的模型。
2.Ollama 对话中进行切换
关闭思考:
/set nothink启动思考:
/set think一旦输入成功之后,后续对话,就会按设置的模式来执行了。
LM Studio 在My Models -> 当前模型 -> Inference -> 提示语 第一行添加
{%- set enable_thinking = false %}Ollama API中关闭思考
payload = {
"model": model,
"messages": messages,
"stream": True, # 启用流式输出
"think": enable_think # Ollama 原生协议:控制模型是否进行思考
}必须是think,后面可以跟True或者False!