baseURL,无需修改其他代码gpt-4o-mini — 轻量快速,适合高频简单任务gpt-4o — 综合推荐,性能与成本平衡gpt-5.2 — 高性能版本,完整支持工具调用GET /api/v1/modelsclaude-haiku-4-5-20251001 — 轻量快速claude-sonnet-4-5-20250929 — 综合推荐claude-sonnet-4-6 — Sonnet 新版claude-opus-4-5-20251101 — 旗舰推理模型claude-opus-4-6 — Opus 新版,能力最强GET /api/v1/modelsrole 和 content。纯文本消息:1。
默认不限制(受模型上下文窗口约束)。max_tokens 的新名称)与 max_tokens 完全等价,两者提供其一即可,max_tokens 优先级更高。true 时,通过 SSE(Server-Sent Events)实时流式返回。默认 true。如需非流式响应,需显式传入 "stream": false。设为 false 时,等待生成完成后一次性返回完整响应。0–20.2):输出更确定、保守0.8):输出更随机、有创意1.0。不建议与 top_p 同时使用。0–1从累积概率达到 top_p 的 token 集合中采样。默认 1.0。
不建议与 temperature 同时使用。-2.0–2.0正值会根据 token 在已生成文本中的出现频率对其进行惩罚,降低重复输出的概率。默认 0。-2.0–2.0正值会对已出现过的 token 进行惩罚,鼓励模型探索新话题。默认 0。"auto" — 模型自行决定是否调用工具(默认)"required" — 强制模型必须调用某个工具"none" — 禁止调用任何工具{"type": "function", "function": {"name": "get_weather"}} — 强制调用指定工具false 时,每次只调用一个工具。默认 true(允许并行)。gpt-5.2 及以上),控制模型推理深度。"low" — 快速推理,节省 token"medium" — 均衡推理"high" — 深度推理,更准确但消耗更多 token"chatcmpl-9vKqnMf3Ax8ZpRdTw2LsYe7b""chat.completion"(非流式)或 "chat.completion.chunk"(流式)Authorization: Bearer <api_key> 格式,使用 OpenAI SDK 时直接设置 api_key 即可。
stream 参数默认为 true。如需非流式响应,需显式传入 "stream": false。
402,请充值后重试。
stop 参数目前不生效,底层供应商暂不支持该功能,传入参数不会报错但也不会在指定序列处停止生成。
response_format 支持有限——json_object 模式下模型可能仍输出 Markdown 代码块而非纯 JSON;json_schema 模式下 Schema 约束可能不被遵守。如需结构化输出,建议在 prompt 中明确描述所需格式。
parameters 字段必须是合法的 JSON Schema,required 数组决定哪些参数为必填项。
-thinking 系列 — 数学证明、逻辑推导等需要深度思考的场景