MiniMax 研究 - 技术分享与产品洞察

AIM3

2026-06-09

MaxProof: 生成式验证强化学习驱动的数学证明进化系统

在 M3 发布推文中，我们汇报了 M3 模型在 IMO 2025 与 USAMO 2026 两组国际数学竞赛真题上的表现：在搭配 MaxProof 框架后，M3 均超过了人类金牌线。本文将进一步展开我们在推进数学证明能力过程中的技术路径，包括基座模型能力增强、verifier 对齐、refinement 能力构建，以及测试时增强框架 MaxProof 的设计。

MiniMax M3：前沿 Coding 能力，1M上下文，原生多模态，一个模型全给你

AIM3

2026-06-01

MiniMax M3：前沿 Coding 能力，1M上下文，原生多模态，一个模型全给你

编程和智能体任务上达到了前沿的能力。它是一个使用全新注意力架构 MSA （MiniMax Sparse Attention ），最高支持 1M 超长上下文。同时，如外界所期待的那样，它也是一个原生多模态模型。

为什么MiniMax大模型不认识"马嘉祺"？Minimax内部排查稀疏 Token 遗忘问题的记录

AI大模型

2026-05-25

为什么MiniMax大模型不认识"马嘉祺"？Minimax内部排查稀疏 Token 遗忘问题的记录

MiniMax M2 系列受到了开发者社区的广泛关注，不少用户在深度使用中发现了一些 corner case——其中"模型无法说出马嘉祺"这个问题引发了较多讨论。本文详细记录了Minimax团队的内部排查过程，从 tokenizer 对齐到 lm_head 退化分析，揭示了稀疏 Token 遗忘的机制及修复方案。

AIAgent

2026-04-27

MiniMax Agent Team: 为长程任务，持续进化而生

今天我们介绍 MiniMax Agent 的整体升级，我们将升级后的 Agent 起了个新名字：Mavis — MiniMax as a Jarvis，你的 AI 管家。

AIM2.7

2026-03-18

MiniMax M2.7: 开启模型的自我进化

在 M2 系列模型发布后的几个月，我们收到了大量热心用户的反馈和建议，这促使我们进一步加速模型的迭代效率。除了更加认真工作之外，我们能找到的唯一途径就是开启模型和组织的自我进化。MiniMax M2.7是我们第一个模型深度参与迭代自己的模型。

AI强化学习

2026-02-12

Forge: 可扩展的 Agent 强化学习框架与算法

把强化学习推到真实世界的 Agent 上,会撞到一个三角约束:系统吞吐、训练稳定性、Agent 灵活性三者互相拉扯,长期阻碍着大规模 RL 在工业级系统中的落地。

AILLM

2026-02-12

MiniMax M2.5: 更快更强更智能，为真实世界生产力而生

今天我们来介绍 MiniMax-M2.5。经过数十万个真实复杂环境中的大规模强化学习训练，M2.5 在编程、工具调用和搜索、办公等生产力场景都达到或者刷新了行业的 SOTA，比如 SWE-Bench Verified（80.2%），Multi-SWE-Bench（51.3%），BrowseComp（76.3%）。M2.5 优化了模型对复杂任务的拆解能力和思考过程中 token 的消耗，使其能更快地完成复杂的 Agentic 任务，比如在 SWE-Bench Verified 的测试中，比上一个版本 M2.1 完成任务的速度快了 37%。

AIRole-Play

2026-01-28

MiniMax-M2-her 技术深度解析

Worlds to Dream, Stories to Live｜一份关于如何在生产环境中构建真正可用的 Role-Play Agent 的技术报告。今年是我们做 Talkie / Xingye 的第三年。三年时间，足以让一个产品在用户生命中留下痕迹，也足以让我们从长期的使用反馈中读出一些不那么显而易见的洞见。

AICoding

2025-12-23

MiniMax M2.1: 大幅提升多语言编程，为真实世界复杂任务而生

MiniMax M2.1 系统性提升了 Rust、Java、Golang、C++ 等多编程语言能力，强化 Web/App 开发美学与复合指令约束，在 SWE-bench、VIBE 等基准上接近 Claude Opus 4.5 水平，并在 Claude Code、Cline、Roo Code 等主流 Agent 框架中展现稳定泛化表现，为真实世界复杂办公与编程任务提供高效解决方案。

AIAgent

2025-10-27

MiniMax M2 & Agent，大巧若拙

MiniMax正式开源并上线MiniMax M2，专为Agent和代码而生，仅Claude Sonnet 8%价格，2倍速度。模型具备顶级代码能力、强大Agentic表现和极致性价比，在Artificial Analysis榜单排名全球前五。同时推出MiniMax Agent产品，提供Lightning高效模式和Pro专业模式，限时免费开放使用。