Claude Messages API
Claude 消息接口
- 完全兼容 Anthropic Messages API 格式
- 支持多轮对话、视觉理解
- 支持流式与非流式两种输出模式
POST
Documentation Index
Fetch the complete documentation index at: https://docs.aireiter.com/llms.txt
Use this file to discover all available pages before exploring further.
Authorizations
Body
模型名称
claude-haiku-4-5-20251001— 轻量快速,适合高频简单任务claude-sonnet-4-5-20250929— 平衡性能与成本,综合推荐claude-sonnet-4-6— Sonnet 新版,性能更强claude-opus-4-5-20251101— 旗舰推理模型,适合复杂分析claude-opus-4-6— Opus 新版,能力最强
GET /api/v1/models消息列表消息数组,模型会基于这些消息生成下一条回复。每条消息包含 多轮对话示例:预填充助手回复:
role 和 content 两个字段。快速填写(Try it 区域):- 点击 ”+ Add an item” 添加一条消息
role输入:user(用户消息)或assistant(AI回复,用于多轮对话)content输入:你想说的话
最大输出 Token 数控制模型最多生成的 token 数量,模型可能在达到上限前自然结束。最小值:
1。不同模型有不同的上下文窗口上限,请参考模型文档。系统提示词设置模型的角色、指令和背景信息。字符串格式(推荐):结构化格式(支持 cache_control):
是否启用流式输出设为
true 时,通过 SSE(Server-Sent Events)实时流式返回。默认 true。如需非流式响应,需显式传入 "stream": false。流式事件顺序:
ping → message_start → content_block_start → content_block_delta × N → content_block_stop → message_delta → message_stop温度,范围
0–1- 低值(如
0.2):输出更确定、保守 - 高值(如
0.8):输出更随机、有创意
1.0。不建议与 top_p 同时使用。核采样参数,范围
0–1从累积概率达到 top_p 的 token 集合中采样。默认 1.0。
不建议与 temperature 同时使用。Top-K 采样只从概率最高的 K 个 token 中采样,过滤低概率长尾。适合高级用例调优。
Response
消息唯一标识符示例:
"msg_01XFDUDYJgAACzvnptvVoYEL"对象类型,固定为
"message"角色,固定为
"assistant"内容块数组文本内容:内容类型:
text(文本)实际处理请求的模型名称
停止原因
end_turn— 自然结束max_tokens— 达到max_tokens上限stop_sequence— 触发了自定义停止序列
若因停止序列而停止,返回触发的序列内容;否则为
nullToken 使用统计
使用示例
基础对话
系统提示词 + 多轮对话
流式响应
视觉理解
流式响应事件格式
注意事项
-
认证方式:支持
x-api-key请求头或Authorization: Bearer两种方式,Anthropic 官方 SDK 默认使用前者。 -
积分不足:余额不足时返回 HTTP
402,请充值后重试。 - 流式断线重连:客户端应实现 SSE 重连机制,连接中断时根据已接收内容判断是否需要重新请求。
-
模型选择建议:
- Haiku — 高频简单问答,成本最低
- Sonnet — 代码生成、文档处理,综合推荐
- Opus — 复杂推理、长文分析,能力最强