Gemini 3.1 Flash Lite (GA) is Google's high-efficiency multimodal model optimized for low-latency, high-volume workloads. GA version of the preview model. Supports full thinking levels (minimal, low, medium, high) for cost/performance trade-offs. Priced at half the cost of Gemini 3 Flash. Released May 7, 2026.
1M 上下文窗口
64K 最大输出 token
发布日期: 2026-05-07
支持的协议:openaigemini
可用供应商:Vertex
能力:视觉函数调用推理提示缓存网络搜索音频输入视频输入PDF 输入
供应商
Vertex
输入 Token
$0.25/M
输出 Token
$1.5/M
缓存读取
$0.025/M
缓存写入
$1/M
音频输入
$0.5/M
缓存写入(1 小时)
$1/M
缓存音频
$0.05/M
网络搜索
$0.014/R
接入协议
openai
/v1/chat/completionsgemini
代码示例
from google import genaiclient = genai.Client(api_key="YOUR_OFOX_API_KEY",http_options={"api_version": "v1beta", "url": "https://api.ofox.io/gemini"},)response = client.models.generate_content(model="google/gemini-3.1-flash-lite",contents="Hello!",)print(response.text)
相关模型
常见问题
Google: Gemini 3.1 Flash Lite 在 Ofox.ai 上的价格为输入 $0.25/M/百万 Token,输出 $1.5/M/百万 Token。按量计费,无月费。
Google: Gemini 3.1 Flash Lite 支持 1M Token 的上下文窗口,最大输出 64K Token,可处理大型文档并维持长对话。
只需将 base URL 设置为 https://api.ofox.ai/v1,并使用你的 Ofox API Key。API 兼容 OpenAI 格式——只需更改 base URL 和 API Key 即可。
Google: Gemini 3.1 Flash Lite 支持以下能力:视觉, 函数调用, 推理, 提示缓存, 网络搜索, 音频输入, 视频输入, PDF 输入。通过 Ofox.ai 统一 API 访问所有功能。