GLM-5.2 是 z.ai 国际站 (api.z.ai) 旗舰推理模型, MoE 架构 open-weights, 1M context, 内嵌 thinking (reasoning_content), 支持 prompt caching / tool calling / web search. 强编码与长程自治执行. 通过 OpenAI-compatible + Anthropic 双协议接入 (无 responses 端点).

1M контекстное окно
128K макс. выходных токенов
Дата релиза: 2026-06-16
Поддерживаемые протоколы:OpenAIopenaiAnthropicanthropic
Доступные провайдеры:ZhipuZhipu
Возможности:Function CallingРассуждениеКэширование промптовВеб-поиск

Providers

ZhipuZhipu
Входные токены
$1.4/M
Выходные токены
$4.4/M
Чтение кэша
$0.26/M
Веб-поиск
$0.01/R
Protocols
OpenAIopenai/v1/chat/completions
Anthropicanthropic

Примеры кода

from openai import OpenAI
client = OpenAI(
base_url="https://api.ofox.io/v1",
api_key="YOUR_OFOX_API_KEY",
)
response = client.chat.completions.create(
model="z-ai/glm-5.2",
messages=[
{"role": "user", "content": "Hello!"}
],
)
print(response.choices[0].message.content)

Часто задаваемые вопросы

Z.ai: GLM-5.2 на Ofox.ai стоит $1.4/M за миллион входных токенов и $4.4/M за миллион выходных токенов. Оплата по потреблению, без абонплаты.