Режим рассуждений (reasoning)
Режим рассуждений заставляет модель «подумать» перед ответом — это повышает качество на сложных задачах. Управляется одним параметром reasoning_effort на одном и том же id модели — отдельные варианты вроде -high не нужны.
reasoning_effort
| Параметр | Тип | Описание |
|---|---|---|
reasoning_effort | "minimal" | "low" | "medium" | "high" | "xhigh" | Глубина рассуждения. Работает на одном id модели — и для GPT (gpt-5.5), и для Claude (claude-opus-4.8) через /v1/chat/completions. |
Чем выше усилие — тем глубже рассуждение, но и больше выходных токенов, а значит дороже запрос. Для простых задач берите
minimal или low; для сложных — high / xhigh.Пример (curl)
curl https://plusvibeapi.ru/v1/chat/completions \
-H "Authorization: Bearer <КЛЮЧ>" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-5.5",
"reasoning_effort": "high",
"messages": [{"role": "user", "content": "Реши задачу пошагово: 17 * 23"}]
}'Пример (OpenAI SDK)
from openai import OpenAI
client = OpenAI(base_url="https://plusvibeapi.ru/v1", api_key="<КЛЮЧ>")
r = client.chat.completions.create(model="gpt-5.5", reasoning_effort="high",
messages=[{"role":"user","content":"Привет!"}])
print(r.choices[0].message.content)Claude: native thinking
Модели Claude дополнительно поддерживают «родной» режим размышления через эндпоинт /v1/messages — параметр thinking с бюджетом токенов budget_tokens:
from anthropic import Anthropic
client = Anthropic(base_url="https://plusvibeapi.ru", api_key="<КЛЮЧ>")
r = client.messages.create(model="claude-opus-4.8", max_tokens=1024,
thinking={"type":"enabled","budget_tokens":1024},
messages=[{"role":"user","content":"Привет!"}])
print(r.content)Итог: через
/v1/chat/completions используйте reasoning_effort для любой модели; через /v1/messages Claude принимает native thinking. Подключение инструментов — в разделе Подключение к инструментам.