编程最强的模型,竟然变成了国产的它
OpenRouter 是一个聚合了上百个模型的 API 调用平台,每周和每月会发布一次模型排行榜。
最近这个榜单的格局,变了。
本月「模型排行榜」的前 10 名里,国产模型占了 4 席:
第 1 名 MiniMax M2.5(5.26T tokens)
第 2 名 Kimi K2.5(4.23T tokens,环比增长 5221%)
第 4 名 DeepSeek V3.2
第 8 名 GLM-5
而「编程排行榜」的前 10 名里,国产模型同样有 4 个:
第 1 名 MiniMax M2.5
第 2 名 GLM-5
第 4 名 MiniMax M2.1
第 5 名 Kimi K2.5
出乎意料的是,国产的 MiniMax M2.5 成为了本月 AI 模型榜单的整体第一名,包括编程领域!
它的核心优势有两点:
- 编程能力还不错:M2.5 的 SWE-Bench Verified 得分 80.2%,编程能力接近行业顶尖;Multi-SWE-Bench(多语言编程)达到 51.3%。端到端完成一个 SWE-Bench 任务只需 22.8 分钟,比 Claude Opus 4.6 的 22.9 分钟还快 0.1。
2.价格实惠:token 费用是 Claude Sonnet 4.6的六分之一左右。98/月可以满足常规使用,再不够还有其他档位。
让我欣喜的是,从中外模型格局上看,国产模型的编程能力已经逐渐进入国际前列,相信用不了多久,我们就可以打破「国外模型更好」的迷信,期待那一天!
你使用哪个模型更多?欢迎留言讨论~