Режим рассуждений (reasoning)

Режим рассуждений заставляет модель «подумать» перед ответом — это повышает качество на сложных задачах. Управляется одним параметром reasoning_effort на одном и том же id модели — отдельные варианты вроде -high не нужны.

reasoning_effort

Параметр	Тип	Описание
`reasoning_effort`	"minimal" \| "low" \| "medium" \| "high" \| "xhigh"	Глубина рассуждения. Работает на одном id модели — и для GPT (`gpt-5.5`), и для Claude (`claude-opus-4.8`) через `/v1/chat/completions`.

Чем выше усилие — тем глубже рассуждение, но и больше выходных токенов, а значит дороже запрос. Для простых задач берите minimal или low; для сложных — high / xhigh.

Пример (curl)

curl https://plusvibeapi.ru/v1/chat/completions \
  -H "Authorization: Bearer <КЛЮЧ>" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-5.5",
    "reasoning_effort": "high",
    "messages": [{"role": "user", "content": "Реши задачу пошагово: 17 * 23"}]
  }'

Пример (OpenAI SDK)

from openai import OpenAI

client = OpenAI(base_url="https://plusvibeapi.ru/v1", api_key="<КЛЮЧ>")
r = client.chat.completions.create(model="gpt-5.5", reasoning_effort="high",
    messages=[{"role":"user","content":"Привет!"}])
print(r.choices[0].message.content)

Claude: native thinking

Модели Claude дополнительно поддерживают «родной» режим размышления через эндпоинт /v1/messages — параметр thinking с бюджетом токенов budget_tokens:

from anthropic import Anthropic

client = Anthropic(base_url="https://plusvibeapi.ru", api_key="<КЛЮЧ>")
r = client.messages.create(model="claude-opus-4.8", max_tokens=1024,
    thinking={"type":"enabled","budget_tokens":1024},
    messages=[{"role":"user","content":"Привет!"}])
print(r.content)

Итог: через /v1/chat/completions используйте reasoning_effort для любой модели; через /v1/messages Claude принимает native thinking. Подключение инструментов — в разделе Подключение к инструментам.

← Подключение к инструментам Аутентификация →