API 文档API 文档
LongCat API Platform
  • English
  • 简体中文
LongCat API Platform
  • English
  • 简体中文
  • 快速开始
  • API文档
  • 常见问题

LongCat-Flash-Chat API 常见问题解答

常规问题

Q: LongCat API开放平台可以提供什么服务?

A: LongCat API开放平台提供专门的 AI 模型接口服务,当前仅支持 LongCat-Flash-Chat 模型的调用。通过兼容 OpenAI 和 Anthropic 的 API 格式,您可以使用现有的 SDK 和工具访问 LongCat-Flash-Chat 模型。

Q: 不同模型需要单独的 API Key 吗?

A: 不需要,您只需一个 LongCat API开放平台的 API Key 即可访问我们的 LongCat-Flash-Chat 模型服务。

认证与 API Key

Q: 如何获取 API Key?

A: 注册账号成功后,系统会自动为每个账号创建一个名为“default”的 API Key。登录开放平台后,前往 API Keys 页面即可查看。

Q: API Key 应该放在哪里?

A: 请在 Authorization 请求头中包含您的 API Key:Authorization: Bearer YOUR_API_KEY

Q: 我的 API Key 无法使用,应该检查什么?

A: 请确认:

  • API Key 格式正确,带有 "Bearer " 前缀
  • 使用了正确的 base URL
  • 账号有足够的额度(每日免费提供 10 万 tokens,目前暂不支持付费充值)

Q: OpenAI 和 Anthropic 两个接口可以用同一个 API key 吗?

A: 可以,同一个 LongCat-Flash-Chat API Key 可用于 /openai/ 和 /anthropic/ 两个接口。

请求格式与参数

Q: OpenAI 和 Anthropic 两个接口有什么区别?

A:

  • OpenAI 接口(/openai/native/chat/completions)遵循 OpenAI 格式,包含 system/user/assistant 角色
  • Anthropic 接口(/anthropic/v1/messages)遵循 Claude 格式,单独的 system 参数
  • 可根据您习惯的格式选择

Q: 如何启用流式响应? A: 在请求体中设置 "stream": true。响应将以 Server-Sent Events (SSE) 形式返回。

Q: 最大 token 限制是多少?

A: LongCat-Flash-Chat 最多输出 8k tokens。

错误处理

Q: 返回 401 Unauthorized 错误是什么原因?

A: 通常原因如下:

  • 缺少或无效的 API Key
  • Authorization 请求头格式错误

Q: 返回 429 Rate Limit 错误是什么原因?

A: 请求过于频繁。请实现指数退避和重试逻辑,或降低请求频率。

Q: 返回 400 Bad Request 错误是什么原因?

A: 请检查:

  • JSON 格式是否正确
  • 是否包含所有必需参数
  • 参数值是否在有效范围内
  • 消息格式是否符合接口要求

Q: "context_length_exceeded" 是什么意思?

A: 您的输入(消息 + max_tokens)超过了模型的最大上下文窗口。建议:

  • 减少消息数量
  • 精简消息内容
  • 降低 max_tokens 参数

SDK 集成

Q: 可以用官方 OpenAI Python SDK 吗?

A: 可以,只需更改 base URL:

openai.api_base = "https://api.longcat.chat/openai/"

Q: 可以用官方 Anthropic Python SDK 吗?

A: 可以,配置 base URL:

client = anthropic.Anthropic(base_url="https://api.longcat.chat/anthropic")

Q: 需要修改我的代码吗?

A: 只需做最小改动——通常只需更新 base URL 和 API Key。请求/响应格式保持兼容。

性能

Q: 响应速度如何?

A: 响应速度取决于:

  • 请求长度和复杂度
  • 服务器负载和地理位置
  • 是否使用流式响应

Q: 是否有速率限制?

A: 有,每个 API Key 都有速率限制。超限时会返回 429 状态码。

Q: 如何处理超时?

A: 请在客户端实现合理的超时处理:

  • 设置合理的连接和读取超时时间
  • 使用指数退避进行重试
  • 对于长响应建议使用流式模式

Q: 可以使用这个吗?

A: 可以,但请确保:

  • 有完善的错误处理和重试逻辑
  • 有监控和告警
  • 客户端有适当的速率限制
  • 服务不可用时有降级方案

故障排查

Q: 我的流式响应突然中断

A: 请检查:

  • 网络连接问题
  • 客户端超时设置
  • 服务器端处理限制
  • 客户端是否正确解析 SSE

Q: 如何调试请求/响应问题?

A:

  • 启用 HTTP 客户端详细日志
  • 检查响应头获取更多错误信息
  • 确认请求格式完全符合文档要求
  • 先用简单请求测试,再逐步增加复杂度

常见集成模式

Q: 如何监控 API 使用?

A: 建议实现日志和监控:

  • 记录请求/响应时间
  • 跟踪 token 使用量
  • 监控错误率
  • 针对额度限制设置告警
最近更新:: 2025/9/5 20:46
Contributors: zhuqi09
Prev
API文档