Gemini

Google: Gemini 2.5 Flash Lite

Chat
google/gemini-2.5-flash-lite

Gemini 2.5 Flash-Lite is a lightweight reasoning model in the Gemini 2.5 family, optimized for ultra-low latency and cost efficiency. It offers improved throughput, faster token generation, and better performance across common benchmarks compared to earlier Flash models. By default, [thinking] (i.e. multi-pass reasoning) is disabled to prioritize speed, but developers can enable it via the Reasoning API parameter to selectively trade off cost for intelligence.

Контекстное окно
1M
Макс. выходных токенов
66K
Дата релиза
2025-07-22
Возможности
ЗрениеFunction CallingКэширование промптовPDF-вход
Доступные провайдеры
GoogleCloudVertex
Поддерживаемые протоколы
OpenAIopenaiGeminigemini

Providers

GoogleCloudVertex
Входные токены
$0.1/M
Выходные токены
$0.4/M
Чтение кэша
$0.025/M
Запись кэша
$1/M
Вход: аудио
$0.3/M
Кэш: аудио
$0.3/M
Веб-поиск
$0.035/R
Protocols
OpenAIopenai/v1/chat/completions
Geminigemini

Примеры кода

from google import genai
client = genai.Client(
api_key="YOUR_OFOX_API_KEY",
http_options={"api_version": "v1beta", "base_url": "https://api.ofox.io/gemini"},
)
response = client.models.generate_content(
model="google/gemini-2.5-flash-lite",
contents="Hello!",
)
print(response.text)

Доступность сервиса

Часто задаваемые вопросы

Google: Gemini 2.5 Flash Lite на Ofox.ai стоит $0.1/M за миллион входных токенов и $0.4/M за миллион выходных токенов. Оплата по потреблению, без абонплаты.