Gemini

Google: Gemini 2.5 Flash Lite

Chat
google/gemini-2.5-flash-lite

Gemini 2.5 Flash-Lite is a lightweight reasoning model in the Gemini 2.5 family, optimized for ultra-low latency and cost efficiency. It offers improved throughput, faster token generation, and better performance across common benchmarks compared to earlier Flash models. By default, [thinking] (i.e. multi-pass reasoning) is disabled to prioritize speed, but developers can enable it via the Reasoning API parameter to selectively trade off cost for intelligence.

컨텍스트 윈도우
1M
최대 출력 토큰
66K
출시일
2025-07-22
기능
비전Function Calling프롬프트 캐싱PDF 입력
제공업체
GoogleCloudVertex
지원 프로토콜
OpenAIopenaiGeminigemini

Providers

GoogleCloudVertex
입력 토큰
$0.1/M
출력 토큰
$0.4/M
캐시 읽기
$0.025/M
캐시 쓰기
$1/M
오디오 입력
$0.3/M
캐시된 오디오
$0.3/M
웹 검색
$0.035/R
Protocols
OpenAIopenai/v1/chat/completions
Geminigemini

코드 예제

from google import genai
client = genai.Client(
api_key="YOUR_OFOX_API_KEY",
http_options={"api_version": "v1beta", "base_url": "https://api.ofox.io/gemini"},
)
response = client.models.generate_content(
model="google/gemini-2.5-flash-lite",
contents="Hello!",
)
print(response.text)

가동 시간 및 상태

자주 묻는 질문

Google: Gemini 2.5 Flash Lite은(는) Ofox.ai에서 입력 $0.1/M/백만 토큰, 출력 $0.4/M/백만 토큰입니다. 종량제, 월정액 없음.