LongCat-Flash-Chat API 常见问题解答
常规问题
Q: LongCat API开放平台可以提供什么服务?
A: LongCat API开放平台提供专门的 AI 模型接口服务,当前仅支持 LongCat-Flash-Chat 模型的调用。通过兼容 OpenAI 和 Anthropic 的 API 格式,您可以使用现有的 SDK 和工具访问 LongCat-Flash-Chat 模型。
Q: 不同模型需要单独的 API Key 吗?
A: 不需要,您只需一个 LongCat API开放平台的 API Key 即可访问我们的 LongCat-Flash-Chat 模型服务。
认证与 API Key
Q: 如何获取 API Key?
A: 注册账号成功后,系统会自动为每个账号创建一个名为“default”的 API Key。登录开放平台后,前往 API Keys 页面即可查看。
Q: API Key 应该放在哪里?
A: 请在 Authorization 请求头中包含您的 API Key:Authorization: Bearer YOUR_API_KEY
Q: 我的 API Key 无法使用,应该检查什么?
A: 请确认:
- API Key 格式正确,带有 "Bearer " 前缀
- 使用了正确的 base URL
- 账号有足够的额度(每日免费提供 10 万 tokens,目前暂不支持付费充值)
Q: OpenAI 和 Anthropic 两个接口可以用同一个 API key 吗?
A: 可以,同一个 LongCat-Flash-Chat API Key 可用于 /openai/
和 /anthropic/
两个接口。
请求格式与参数
Q: OpenAI 和 Anthropic 两个接口有什么区别?
A:
- OpenAI 接口(
/openai/native/chat/completions
)遵循 OpenAI 格式,包含 system/user/assistant 角色 - Anthropic 接口(
/anthropic/v1/messages
)遵循 Claude 格式,单独的 system 参数 - 可根据您习惯的格式选择
Q: 如何启用流式响应? A: 在请求体中设置 "stream": true
。响应将以 Server-Sent Events (SSE) 形式返回。
Q: 最大 token 限制是多少?
A: LongCat-Flash-Chat 最多输出 8k tokens。
错误处理
Q: 返回 401 Unauthorized 错误是什么原因?
A: 通常原因如下:
- 缺少或无效的 API Key
- Authorization 请求头格式错误
Q: 返回 429 Rate Limit 错误是什么原因?
A: 请求过于频繁。请实现指数退避和重试逻辑,或降低请求频率。
Q: 返回 400 Bad Request 错误是什么原因?
A: 请检查:
- JSON 格式是否正确
- 是否包含所有必需参数
- 参数值是否在有效范围内
- 消息格式是否符合接口要求
Q: "context_length_exceeded" 是什么意思?
A: 您的输入(消息 + max_tokens)超过了模型的最大上下文窗口。建议:
- 减少消息数量
- 精简消息内容
- 降低 max_tokens 参数
SDK 集成
Q: 可以用官方 OpenAI Python SDK 吗?
A: 可以,只需更改 base URL:
openai.api_base = "https://api.longcat.chat/openai/"
Q: 可以用官方 Anthropic Python SDK 吗?
A: 可以,配置 base URL:
client = anthropic.Anthropic(base_url="https://api.longcat.chat/anthropic")
Q: 需要修改我的代码吗?
A: 只需做最小改动——通常只需更新 base URL 和 API Key。请求/响应格式保持兼容。
性能
Q: 响应速度如何?
A: 响应速度取决于:
- 请求长度和复杂度
- 服务器负载和地理位置
- 是否使用流式响应
Q: 是否有速率限制?
A: 有,每个 API Key 都有速率限制。超限时会返回 429 状态码。
Q: 如何处理超时?
A: 请在客户端实现合理的超时处理:
- 设置合理的连接和读取超时时间
- 使用指数退避进行重试
- 对于长响应建议使用流式模式
Q: 可以使用这个吗?
A: 可以,但请确保:
- 有完善的错误处理和重试逻辑
- 有监控和告警
- 客户端有适当的速率限制
- 服务不可用时有降级方案
故障排查
Q: 我的流式响应突然中断
A: 请检查:
- 网络连接问题
- 客户端超时设置
- 服务器端处理限制
- 客户端是否正确解析 SSE
Q: 如何调试请求/响应问题?
A:
- 启用 HTTP 客户端详细日志
- 检查响应头获取更多错误信息
- 确认请求格式完全符合文档要求
- 先用简单请求测试,再逐步增加复杂度
常见集成模式
Q: 如何监控 API 使用?
A: 建议实现日志和监控:
- 记录请求/响应时间
- 跟踪 token 使用量
- 监控错误率
- 针对额度限制设置告警