Google: Gemini 2.5 Flash Lite
Chatgoogle/gemini-2.5-flash-liteGemini 2.5 Flash-Lite is a lightweight reasoning model in the Gemini 2.5 family, optimized for ultra-low latency and cost efficiency. It offers improved throughput, faster token generation, and better performance across common benchmarks compared to earlier Flash models. By default, [thinking] (i.e. multi-pass reasoning) is disabled to prioritize speed, but developers can enable it via the Reasoning API parameter to selectively trade off cost for intelligence.
上下文視窗
1M
最大輸出 Token
66K
發布日期
2025-07-22
能力
視覺函式呼叫提示快取PDF 輸入
可用供應商
Vertex
支援的協定
openaigemini
供应商
Vertex
輸入 Token
$0.1/M
輸出 Token
$0.4/M
快取讀取
$0.025/M
快取寫入
$1/M
音訊輸入
$0.3/M
快取音訊
$0.3/M
網路搜尋
$0.035/R
接入协议
openai
/v1/chat/completionsgemini
程式碼範例
from google import genaiclient = genai.Client(api_key="YOUR_OFOX_API_KEY",http_options={"api_version": "v1beta", "base_url": "https://api.ofox.io/gemini"},)response = client.models.generate_content(model="google/gemini-2.5-flash-lite",contents="Hello!",)print(response.text)
運行狀態
相關模型
更多 google 模型
常見問題
Google: Gemini 2.5 Flash Lite 在 Ofox.ai 上的價格為輸入 $0.1/M/百萬 Token,輸出 $0.4/M/百萬 Token。按量計費,無月費。
Google: Gemini 2.5 Flash Lite 支援 1M Token 的上下文視窗,最大輸出 66K Token,可處理大型文件並維持長對話。
只需將 base URL 設定為 https://api.ofox.ai/v1,並使用你的 Ofox API Key。API 相容 OpenAI 格式——只需更改 base URL 和 API Key 即可。
Google: Gemini 2.5 Flash Lite 支援以下能力:視覺, 函式呼叫, 提示快取, PDF 輸入。透過 Ofox.ai 統一 API 存取所有功能。