Google: Gemini 2.5 Flash Lite
Chatgoogle/gemini-2.5-flash-liteGemini 2.5 Flash-Lite is a lightweight reasoning model in the Gemini 2.5 family, optimized for ultra-low latency and cost efficiency. It offers improved throughput, faster token generation, and better performance across common benchmarks compared to earlier Flash models. By default, [thinking] (i.e. multi-pass reasoning) is disabled to prioritize speed, but developers can enable it via the Reasoning API parameter to selectively trade off cost for intelligence.
上下文窗口
1M
最大输出 Token
66K
发布日期
2025-07-22
能力
视觉函数调用提示缓存PDF 输入
可用供应商
Vertex
支持的协议
openaigemini
供应商
Vertex
输入 Token
$0.1/M
输出 Token
$0.4/M
缓存读取
$0.025/M
缓存写入
$1/M
音频输入
$0.3/M
缓存音频
$0.3/M
网络搜索
$0.035/R
接入协议
openai
/v1/chat/completionsgemini
代码示例
from google import genaiclient = genai.Client(api_key="YOUR_OFOX_API_KEY",http_options={"api_version": "v1beta", "base_url": "https://api.ofox.io/gemini"},)response = client.models.generate_content(model="google/gemini-2.5-flash-lite",contents="Hello!",)print(response.text)
运行状态
相关模型
更多 google 模型
常见问题
Google: Gemini 2.5 Flash Lite 在 Ofox.ai 上的价格为输入 $0.1/M/百万 Token,输出 $0.4/M/百万 Token。按量计费,无月费。
Google: Gemini 2.5 Flash Lite 支持 1M Token 的上下文窗口,最大输出 66K Token,可处理大型文档并维持长对话。
只需将 base URL 设置为 https://api.ofox.ai/v1,并使用你的 Ofox API Key。API 兼容 OpenAI 格式——只需更改 base URL 和 API Key 即可。
Google: Gemini 2.5 Flash Lite 支持以下能力:视觉, 函数调用, 提示缓存, PDF 输入。通过 Ofox.ai 统一 API 访问所有功能。