接口用途与路由
/chat/completions 用于发起文本对话请求,适合单轮问答、多轮上下文续写、摘要、改写和通用指令式生成。
基础地址固定为:
请求体字段
下面是最常用的请求字段:model
model
要调用的模型名称。它必须是当前可用且填写正确的值。
messages
messages
对话消息数组,也是这个接口最核心的字段。每条消息通常包含
role 和 content。temperature
temperature
可选。用于控制输出的发散程度。数值越高,结果通常越灵活;数值越低,结果通常越稳定。
max_tokens
max_tokens
可选。用于限制本次生成的最大输出 token 数。
stream
stream
可选。设为
true 时,响应会按流式分块返回;未设置或为 false 时,返回完整 JSON 结果。messages 结构
messages 是一个按顺序排列的数组。常见角色如下:
system:定义助手行为、语气或回答边界user:用户输入的问题或指令assistant:历史回答内容,用于继续多轮对话
多轮对话示例
如果你要继续上下文,就把历史消息按顺序一起传入:标准请求示例
标准响应示例
非流式请求通常会返回完整 JSON,结构类似下面这样:choices[0].message.content:模型输出内容finish_reason:生成结束原因usage:token 消耗统计
流式返回说明
如果请求中显式传入"stream": true,可以按流式方式接收增量结果。此时服务端会持续推送分块内容,客户端应按 SSE 风格逐段读取,而不是等待单个完整 JSON 一次性返回。
一个流式请求示例:
如果你使用的是官方 OpenAI SDK,是否以及如何消费流式结果,还取决于客户端代码写法。文档这里重点说明
stream 参数和分块返回方式本身。常见错误与排查
401 Unauthorized:认证失败
401 Unauthorized:认证失败
400 Bad Request:请求体不合法
400 Bad Request:请求体不合法
常见原因包括
messages 不是数组、缺少 model、字段类型错误,或 JSON 格式本身不合法。模型不可用或模型名错误
模型不可用或模型名错误
如果返回模型不存在或不可用,请先确认
model 是否填写为当前支持的有效名称。调用地址错误
调用地址错误
Base URL 必须是
https://niuapi.vip/v1。如果漏掉 /v1,或把 SDK Base URL 写成完整接口路径,都会导致请求异常。流式读取没有结果或提前中断
流式读取没有结果或提前中断
请确认你已传入
stream: true,并且客户端确实按流式方式读取响应;如果按普通 JSON 解析,通常会表现为读取失败或结果不完整。