就在昨天 2025 年 12 月 16 日小米的MiMo-V2-Flash 正式开源!这是一个专为极致推理效率自研的总参数 309B(激活 15B)的 MoE 模型,通过 Hybrid 注意力架构创新及多层 MTP 推理加速,在多个 Agent 测评基准上保持进入全球开源模型 Top 2;代码能力超过所有开源模型,比肩标杆闭源模型 Claude 4.5 Sonnet,但推理成本仅为其 2.5%,生成速度提升 2 倍,成功将大模型推理效率推向极致。

直接来一张官方贴图,限时 15 天免费公测,API 也全部免费可以去白嫖了。

小米最新 MoE 大模型 MiMo-V2-Flash 限时免费公测

地址汇总

Github 地址:点此跳转

API 申请使用:点此跳转,平台公测期间截止到 2025 年最后一天,模型推理服务免费,暂未定价。

网页版直接对话:点此跳转

小米最新 MoE 大模型 MiMo-V2-Flash 限时免费公测

总结

尝试了一下,速度快是挺快的,上下文衔接得不是很好,前面问了后面就跟傻了一样,这公测界面日常问题重度使用一下试试,看看是不是“吹”的那么牛逼。

API可以直接在各大平台使用,因为是兼容 OpenAI API 、Anthropic API 两种主流 API 格式。

OpenAI API 端点地址:https://api.xiaomimimo.com/anthropic

Anthropic 端点地址:https://api.xiaomimimo.com/anthropic

模型名称:mimo-v2-flash

文章目录