Google: Gemini 2.5 Flash Lite
Chatgoogle/gemini-2.5-flash-liteGemini 2.5 Flash-Lite is a lightweight reasoning model in the Gemini 2.5 family, optimized for ultra-low latency and cost efficiency. It offers improved throughput, faster token generation, and better performance across common benchmarks compared to earlier Flash models. By default, [thinking] (i.e. multi-pass reasoning) is disabled to prioritize speed, but developers can enable it via the Reasoning API parameter to selectively trade off cost for intelligence.
Janela de Contexto
1M
Tokens Máx de Saída
66K
Lançamento
2025-07-22
Capacidades
VisãoFunction CallingPrompt CachingEntrada PDF
Provedores Disponíveis
Vertex
Protocolos Suportados
openaigemini
Providers
Vertex
Tokens de Entrada
$0.1/M
Tokens de Saída
$0.4/M
Leitura de Cache
$0.025/M
Escrita de Cache
$1/M
Entrada de Áudio
$0.3/M
Áudio em Cache
$0.3/M
Busca Web
$0.035/R
Protocols
openai
/v1/chat/completionsgemini
Exemplos de Código
from google import genaiclient = genai.Client(api_key="YOUR_OFOX_API_KEY",http_options={"api_version": "v1beta", "base_url": "https://api.ofox.io/gemini"},)response = client.models.generate_content(model="google/gemini-2.5-flash-lite",contents="Hello!",)print(response.text)
Disponibilidade e status
Modelos Relacionados
Mais de google
Perguntas Frequentes
Google: Gemini 2.5 Flash Lite na Ofox.ai custa $0.1/M por milhão de tokens de entrada e $0.4/M por milhão de tokens de saída. Pague por uso, sem mensalidade.
Google: Gemini 2.5 Flash Lite suporta uma janela de contexto de 1M tokens com saída máxima de 66K tokens, permitindo processar documentos grandes e manter conversas longas.
Basta definir sua base URL como https://api.ofox.ai/v1 e usar sua API key Ofox. A API é compatível com OpenAI — apenas mude a base URL e a API key no seu código existente.
Google: Gemini 2.5 Flash Lite suporta as seguintes capacidades: Visão, Function Calling, Prompt Caching, Entrada PDF. Acesse todos os recursos pela API unificada Ofox.ai.