LongCat API开放平台更新日志

版本: 2026-06-30

LongCat-2.0 发布 & 全新推出计费服务

  • LongCat-2.0的核心特性如下:

    • 万亿参数,1M超长上下文:原生工具调用与多步推理,稳定承载长上下文 Agent 任务。

    • 卓越的 Coding 能力:在代码生成、代码理解与自动化编程任务上表现突出。

    • 深度适配 Claude Code 等主流开发环境:与 Claude Code、Hermes、OpenClaw、OpenCode、Kilo Code 高效协同。

  • LongCat API 开放平台全新推出计费服务,提供以下两种计费方式:

    • Token 资源包:Token 资源包是一次性购买固定 Token 额度,购买后 30 个自然日内有效,适合短期内有大量 Token 需求的场景。

    • API 按量计费:API 按量计费是先充值余额,后按实际 Token 消耗扣费的计费模式,适合用量不稳定或想精确控制成本的场景。

  • 调用指南请参考:LongCat API 开放平台接口文档

版本: 2026-05-29

LongCat 部分模型服务下线

  • LongCat-2.0-Preview 上线测试以来,用户申请非常踊跃,服务资源需要持续增加。LongCat API 开放平台将停止老模型的测试,集中资源支持好 LongCat-2.0-Preview 的测试和迭代。自 2026年5月29日 起,平台将停止以下 6 个模型的调用服务:

    • LongCat-Flash-Chat

    • LongCat-Flash-Thinking

    • LongCat-Flash-Thinking-2601

    • LongCat-Flash-Lite

    • LongCat-Flash-Omni-2603

    • LongCat-Flash-Chat-2602-Exp

  • 请您根据使用需要做好模型迁移,欢迎申请试用 LongCat-2.0-Preview,每日09:00:00 和 21:00:00(UTC+8)限量开放内测名额,名额数量将逐步扩大,先到先得。感谢您的理解与支持。

版本: 2026-04-20

LongCat-2.0-Preview 发布

  • LongCat-2.0-Preview的核心特性如下:

    • 面向Agent开发场景,原生支持工具调用、多步推理和长上下文任务;

    • 在代码开生成、自动化工作流和复杂指令执行上表现突出;

    • 深度适配 Claude Code、OpenClaw、OpenCode和Kilo Code等生产力工具。

  • 初始额度5,000,000 Tokens/天,提交模型使用反馈,每次有效的反馈都将有机会获得额度刷新,每日最多可获得120,000,000 Tokens。

  • 调用指南请参考:LongCat API 开放平台接口文档

版本: 2026-03-12

LongCat-Flash-Thinking 升级

  • 为确保您获得顶级推理性能,LongCat API开放平台已对LongCat-Flash-Thinking模型的调用进行统一升级。所有原 model=LongCat-Flash-Thinking 请求将自动切换至最新版本 LongCat-Flash-Thinking-2601,无需任何代码修改。

  • 生效时间:2026-03-12 20:00:00 (UTC+8)

  • 调用指南请参考: LongCat API 开放平台接口文档

版本: 2026-03-11

LongCat-Flash-Omni-2603 发布

  • LongCat-Flash-Omni-2603正式发布。该模型作为LongCat-Flash-Omni的升级版,是一款回复拟人度更高、全模态感知能力更强的端到端Omni交互模型。可以在LongCat Chat中免费对话,也可以通过指定 model=LongCat-Flash-Omni-2603 调用。

  • 相较于 LongCat-Flash-Omni 模型,LongCat-Flash-Omni-2603核心特性如下:

    • 深度语义对齐与个性化风格适配,对话体验更加自然流畅。
    • 视觉、语音、文本多模态任务准确率全面提升。
    • 问题解决、情感理解与日常娱乐场景表现显著增强。
    • 支持原生语音Function Call能力,直接解析音频指令,实时交互几乎零延迟。
  • 调用指南请参考: LongCat API 开放平台接口文档

版本: 2026-02-05

LongCat-Flash-Lite 发布

  • LongCat-Flash-Lite正式发布。该模型采用高效 MoE 架构(总参数 685亿,激活参数约 30亿),通过 N-gram 嵌入表实现参数的高效利用,并针对推理效率与特定场景深度优化。
  • 相较于同量级模型,模型核心特性如下:
    • 卓越的推理效率:通过 N-gram 嵌入表从底层缓解 MoE 的 I/O 瓶颈,配合专用缓存与内核优化,大幅降低推理延迟并提升效率;
    • 强大的 Agent 与代码性能:在工具调用和代码开发领域展现出极强的竞争力,相对于其模型规模表现十分出色。
  • 调用指南请参考:LongCat API开放平台接口文档
  • 开源平台地址

版本: 2026-01-14

LongCat-Flash-Thinking-2601 发布

  • LongCat-Flash-Thinking-2601正式发布。该模型作为升级版推理模型,基于混合专家(MoE)架构,总参数量达 5600 亿。在保持传统推理基准极强竞争力的同时,通过大规模多环境强化学习,系统性增强了Agent思维能力。

  • 相较于 LongCat-Flash-Thinking 模型,本次升级核心特性如下:

    • 极致的抗噪环境鲁棒性:针对现实环境中的噪声与不确定性开展系统性课程式训练,模型在Agent工具调用、Agent搜索及工具融合推理领域表现卓越,泛化能力显著提升;
    • 强大的 Agent 能力:构建包含 60 余种工具的紧密依赖图谱,通过多环境扩展与大规模探索训练,显著提升模型在复杂、分布外现实场景中的泛化能力;
    • 先进的深度思考模式:利用并行推理拓展思维广度,配合递归反馈的总结归纳机制拓展思维深度,有效攻克高难度问题。
  • 调用指南请参考: LongCat API 开放平台接口文档

  • 开源平台地址

版本: 2025-12-22

LongCat-Flash-Chat更新

  • LongCat-Flash-Chat模型已升级至新版本。本次升级仅涉及模型能力更新,模型名称及API调用方式保持不变。

  • 新版本的LongCat-Flash-Chat模型在延续“极致效率”与“闪电级响应”的基础上,进一步提升了模型上下文与编程实战能力:

    • 编程能力显著增强:面向开发者场景进行深度优化,在代码生成、调试与解释等任务中表现大幅提升,推荐开发者重点关注与测试;
    • 支持256K超长上下文:上下文长度较上一代模型(128K)翻倍,可高效处理海量文档与长序列任务;
    • 多语言能力全面加强:出色支持西班牙语、法语、阿拉伯语、葡萄牙语、俄语、印尼语等9种语言;
    • 更强大的Agent能力:在复杂工具调用与多步任务执行中表现更加稳健、高效。
  • 调用指南请参考:LongCat API 开放平台接口文档

版本: 2025-09-22

LongCat-Flash-Thinking发布

版本: 2025-09-05

LongCat API开放平台上线

  • LongCat API开放平台上线,支持API调用模型LongCat-Flash-Chat,可以通过指定 model=Loncat-Flash-Chat 调用。

  • 调用指南请参考: LongCat API开放平台接口文档

版本: 2025-08-29

LongCat-Flash-Chat发布