小米发布MiMo-V2-Flash大模型:开源、极速、剑指AGI新高度

2025年12月17日,在年度"人车家全生态合作伙伴大会"前夕,小米集团正式推出其自研的超大参数规模语言模型MiMo-V2-Flash,并宣布以MIT协议全面开源。这款总参数高达3090亿、激活参数150亿的MoE架构模型,不仅在代码能力上创下开源模型新纪录,更以极致的推理速度和极具竞争力的成本,向全球开发者社区抛出橄榄枝。这是前DeepSeek-V2核心开发者罗福莉加盟小米后的首秀之作,也是小米在AGI征途上的关键落子。

小米发布MiMo-V2-Flash大模型:开源、极速、剑指AGI新高度

一、发布背景:小米AI战略的关键一跃

1.1 战略时间节点

12月17日,小米选择在其年度生态大会当天发布MiMo-V2-Flash,彰显其在AI基础设施层的雄心。小米集团总裁卢伟冰在大会主题演讲中,将这款模型定义为 "迈向Agent时代的全新语言基座" 。根据小米公布的AI路线图,MiMo-V2-Flash是MiMo系列的重要里程碑,此前已布局MiMo-7B、MiMo-VL视觉模型、MiMo-Audio音频模型等全线产品。

1.2 人才投入与资源倾斜

此次发布背后是小米持续加码的AI投入。卢伟冰透露,过去四个季度公司AI投入环比增速超50%,并启动全球人才招募,单岗位薪酬上限达千万元。而统领这一项目的,正是11月12日刚刚官宣加盟的前DeepSeek-V2核心开发者罗福莉。这位在北京师范大学本科、北京大学计算语言学硕士毕业的AI专家,曾任职阿里达摩院,后深度参与DeepSeek-V2开发。她在朋友圈写道:"智能终将从语言迈向物理世界",暗示小米AI将深度融入其硬件生态。


二、技术规格:参数规模与架构创新

2.1 基础参数

MiMo-V2-Flash采用MoE(Mixture of Experts)架构,总参数量达到 309B(3090亿) ,激活参数量为 15B(150亿) 。这一规模使其跻身当前开源大模型第一梯队,与DeepSeek-V3.2、Kimi-K2等头部模型直接竞争。

2.2 上下文与速度

模型提供256k的上下文窗口,原生支持32K并外扩至256K训练,能够完成数百轮Agent交互和复杂工具调用任务。其最引人注目的特性是每秒150个token的推理速度,响应延迟显著优于同类模型。

2.3 定价策略

在API定价上,小米展现了极致的性价比:

输入:0.7元/百万tokens(约0.1美元)

输出:2.1元/百万tokens(约0.3美元)

这一价格仅为Claude Sonnet 4.5的2.5%,且目前API处于限时免费阶段。


三、核心亮点:代码能力与推理效率双突破

3.1 代码能力:超越所有开源模型

MiMo-V2-Flash最引以为傲的是其代码能力。在权威的SWE-bench Verified基准测试中,该模型得分高达73.4%,超越所有开源模型,直逼GPT-5-High,与闭源标杆Claude Sonnet 4.5并肩。这一测试要求AI修复真实世界的软件bug,73.4%的成功率意味着它能搞定大部分实际编程问题。

在多语言编程测试SWE-Bench Multilingual中,其解决率达到71.7%。用户实测显示,它能一键生成功能齐全的HTML网页,并与Claude Code、Cursor、Cline等主流编码框架无缝协同。

3.2 推理与Agent能力

模型专为推理、编码和Agent场景构建,支持混合思维模式,允许用户自由切换"深度思考"与"即时回答"。在多项基准测试中表现优异:

AIME 2025数学竞赛:位列开源模型前两名

GPQA-Diamond科学知识测试:位列开源模型前两名

τ²-Bench智能体任务:通信类95.3分、零售类79.5分、航空类66.0分

BrowseComp搜索代理:启用上下文管理后得分从45.4提升至58.3

3.3 架构创新:速度与内存的双重优化

技术报告披露了两项关键创新:

1. 5:1混合注意力机制:采用Global Attention与Sliding Window Attention(SWA)混合结构,将KV缓存存储量减少近6倍

2. 多词元预测模块(MTP):使推理速度提升2至2.6倍

这些激进的设计让MiMo-V2-Flash在保持高性能的同时,实现了极致的效率。

小米发布MiMo-V2-Flash大模型:开源、极速、剑指AGI新高度


小米发布MiMo-V2-Flash大模型:开源、极速、剑指AGI新高度

四、全面开源:开发者生态的诚意之作

4.1 开源范围

小米此次展现了极大的开源诚意:

模型权重:已在Hugging Face发布

推理代码:向SGLang开发者社区贡献全部代码

技术报告:完整论文公开在GitHub

协议:采用MIT开源协议,允许商业使用

4.2 体验渠道

开发者与用户可通过以下方式体验:

Web Demo:Xiaomi MiMO Studio(https://aistudio.xiaomimimo.com)

GitHub仓库:https://github.com/xiaomimimo/MiMo-V2-Flash

Hugging Face:https://hf.co/XiaomiMiMo/MiMo-V2-Flash

开放平台:https://platform.xiaomimimo.com/


五、行业影响:开源生态的新变量

MiMo-V2-Flash的发布在国内外开发者社区引发热议。其"超绝性价比"和"代码全球最强"的定位,直接挑战了DeepSeek-V3.2、Kimi-K2等开源头部模型。性能评测显示,其综合性能基本与DeepSeek-V3.2相当,仅在"人类最后一场考试"和ARENA-HARD创意文本生成中略逊,但时延更小。

小米将AI能力与其"人车家全生态"深度绑定,罗福莉"从语言迈向物理世界"的愿景,暗示这款模型未来将在小米汽车、智能家居、手机等终端发挥核心作用。在AGI竞赛白热化的当下,MiMo-V2-Flash的开源策略无疑为小米赢得了技术影响力与生态伙伴的双重筹码。


六、结论:AGI征途的"小米加速度"

MiMo-V2-Flash不仅是小米技术实力的集中展示,更是其AI战略从追赶转向引领的标志性产品。通过开源、极速、低成本的三重优势,小米正在构建一个开放、高效的AI开发者生态。罗福莉团队的首秀答卷证明,小米有实力在AGI赛道上跑出"加速度"。未来,随着模型在小米全生态场景的深度融合,"智能从语言迈向物理世界"的愿景或将加速实现。


参考资料与链接:

1. 新浪财经(智东西):《小米突然发布!代码全球最强,总体媲美DeepSeek-V3.2》  

   https://finance.sina.com.cn/stock/t/2025-12-17/doc-inhcaksr7672666.shtml  

   (2025-12-17)

2. IT之家:《小米网页AI聊天服务惊喜亮相,MiMo-V2-Flash模型发布》  

   https://www.ithome.com/0/905/520.htm  

   (2025-12-16)

3. DoNews:《小米发布新模型MiMo-V2-Flash:媲美DeepSeek-V3.2》  

   https://www.donews.com/news/detail/1/6311141.html  

   (2025-12-17)

4. 东方财富网:《小米MiMo-V2-Flash开源》  

   https://finance.eastmoney.com/a/202512173593932748.html  

   (2025-12-17)

5. 快科技:《小米自研大模型MiMo-V2-Flash开源上线 卢伟冰:迈向Agent时代的全新语言基座》  

   https://news.mydrivers.com/1/1092/1092979.htm  

   (2025-12-17)

6. 每日经济新闻:《小米MiMo-V2-Flash开源》  

   https://www.nbd.com.cn/articles/2025-12-17/4183917.html  

   (2025-12-17)

7. 中关村在线:《小米发布开源大模型MiMo-V2-Flash,3090亿参数赋能AI生态》  

   https://ai.zol.com.cn/1100/11009654.html  

   (2025-12-17)

8. 网易:《罗福莉加盟小米首战告捷:MiMo-V2-Flash开源,全力冲刺AGI》  

   https://www.163.com/dy/article/KGVLSE9N0511KIFE.html  

   (2025-12-17)