Z.ai: GLM-5.2
Chatz-ai/glm-5.2GLM-5.2 是 z.ai 国际站 (api.z.ai) 旗舰推理模型, MoE 架构 open-weights, 1M context, 内嵌 thinking (reasoning_content), 支持 prompt caching / tool calling / web search. 强编码与长程自治执行. 通过 OpenAI-compatible + Anthropic 双协议接入 (无 responses 端点).
1M fenêtre de contexte
128K tokens de sortie max
Publié: 2026-06-16
Protocoles supportés:openaianthropic
Fournisseurs disponibles:Zhipu
Capacités:Function CallingRaisonnementPrompt CachingRecherche web
Providers
Zhipu
Tokens d'entrée
$1.4/M
Tokens de sortie
$4.4/M
Lecture cache
$0.26/M
Recherche web
$0.01/R
Protocols
openai
/v1/chat/completionsanthropic
Exemples de code
from openai import OpenAIclient = OpenAI(base_url="https://api.ofox.io/v1",api_key="YOUR_OFOX_API_KEY",)response = client.chat.completions.create(model="z-ai/glm-5.2",messages=[{"role": "user", "content": "Hello!"}],)print(response.choices[0].message.content)
Modèles associés
Questions fréquentes
Z.ai: GLM-5.2 sur Ofox.ai coûte $1.4/M par million de tokens d'entrée et $4.4/M par million de tokens de sortie. Paiement à l'usage, sans frais mensuels.
Z.ai: GLM-5.2 supporte une fenêtre de contexte de 1M tokens avec un maximum de 128K tokens en sortie, permettant de traiter de longs documents et de maintenir des conversations prolongées.
Configurez simplement votre URL de base sur https://api.ofox.ai/v1 et utilisez votre clé API Ofox. L'API est compatible OpenAI — changez simplement l'URL de base et la clé API dans votre code existant.
Z.ai: GLM-5.2 supporte les capacités suivantes : Function Calling, Raisonnement, Prompt Caching, Recherche web. Accédez à toutes les fonctionnalités via l'API unifiée Ofox.ai.