小米发布MiMo-V2-Flash大模型:开源、极速、剑指AGI新高度
2025年12月17日,在年度"人车家全生态合作伙伴大会"前夕,小米集团正式推出其自研的超大参数规模语言模型MiMo-V2-Flash,并宣布以MIT协议全面开源。这款总参数高达3090亿、激活参数150亿的MoE架构模型,不仅在代码能力上创下开源模型新纪录,更以极致的推理速度和极具竞争力的成本,向全球开发者社区抛出橄榄枝。这是前DeepSeek-V2核心开发者罗福莉加盟小米后的首秀之作,也是小米在AGI征途上的关键落子。

一、发布背景:小米AI战略的关键一跃
1.1 战略时间节点
12月17日,小米选择在其年度生态大会当天发布MiMo-V2-Flash,彰显其在AI基础设施层的雄心。小米集团总裁卢伟冰在大会主题演讲中,将这款模型定义为 "迈向Agent时代的全新语言基座" 。根据小米公布的AI路线图,MiMo-V2-Flash是MiMo系列的重要里程碑,此前已布局MiMo-7B、MiMo-VL视觉模型、MiMo-Audio音频模型等全线产品。
1.2 人才投入与资源倾斜
此次发布背后是小米持续加码的AI投入。卢伟冰透露,过去四个季度公司AI投入环比增速超50%,并启动全球人才招募,单岗位薪酬上限达千万元。而统领这一项目的,正是11月12日刚刚官宣加盟的前DeepSeek-V2核心开发者罗福莉。这位在北京师范大学本科、北京大学计算语言学硕士毕业的AI专家,曾任职阿里达摩院,后深度参与DeepSeek-V2开发。她在朋友圈写道:"智能终将从语言迈向物理世界",暗示小米AI将深度融入其硬件生态。
二、技术规格:参数规模与架构创新
2.1 基础参数
MiMo-V2-Flash采用MoE(Mixture of Experts)架构,总参数量达到 309B(3090亿) ,激活参数量为 15B(150亿) 。这一规模使其跻身当前开源大模型第一梯队,与DeepSeek-V3.2、Kimi-K2等头部模型直接竞争。
2.2 上下文与速度
模型提供256k的上下文窗口,原生支持32K并外扩至256K训练,能够完成数百轮Agent交互和复杂工具调用任务。其最引人注目的特性是每秒150个token的推理速度,响应延迟显著优于同类模型。
2.3 定价策略
在API定价上,小米展现了极致的性价比:
输入:0.7元/百万tokens(约0.1美元)
输出:2.1元/百万tokens(约0.3美元)
这一价格仅为Claude Sonnet 4.5的2.5%,且目前API处于限时免费阶段。
三、核心亮点:代码能力与推理效率双突破
3.1 代码能力:超越所有开源模型
MiMo-V2-Flash最引以为傲的是其代码能力。在权威的SWE-bench Verified基准测试中,该模型得分高达73.4%,超越所有开源模型,直逼GPT-5-High,与闭源标杆Claude Sonnet 4.5并肩。这一测试要求AI修复真实世界的软件bug,73.4%的成功率意味着它能搞定大部分实际编程问题。
在多语言编程测试SWE-Bench Multilingual中,其解决率达到71.7%。用户实测显示,它能一键生成功能齐全的HTML网页,并与Claude Code、Cursor、Cline等主流编码框架无缝协同。
3.2 推理与Agent能力
模型专为推理、编码和Agent场景构建,支持混合思维模式,允许用户自由切换"深度思考"与"即时回答"。在多项基准测试中表现优异:
AIME 2025数学竞赛:位列开源模型前两名
GPQA-Diamond科学知识测试:位列开源模型前两名
τ²-Bench智能体任务:通信类95.3分、零售类79.5分、航空类66.0分
BrowseComp搜索代理:启用上下文管理后得分从45.4提升至58.3
3.3 架构创新:速度与内存的双重优化
技术报告披露了两项关键创新:
1. 5:1混合注意力机制:采用Global Attention与Sliding Window Attention(SWA)混合结构,将KV缓存存储量减少近6倍
2. 多词元预测模块(MTP):使推理速度提升2至2.6倍
这些激进的设计让MiMo-V2-Flash在保持高性能的同时,实现了极致的效率。


四、全面开源:开发者生态的诚意之作
4.1 开源范围
小米此次展现了极大的开源诚意:
模型权重:已在Hugging Face发布
推理代码:向SGLang开发者社区贡献全部代码
技术报告:完整论文公开在GitHub
协议:采用MIT开源协议,允许商业使用
4.2 体验渠道
开发者与用户可通过以下方式体验:
Web Demo:Xiaomi MiMO Studio(https://aistudio.xiaomimimo.com)
GitHub仓库:https://github.com/xiaomimimo/MiMo-V2-Flash
Hugging Face:https://hf.co/XiaomiMiMo/MiMo-V2-Flash
开放平台:https://platform.xiaomimimo.com/
五、行业影响:开源生态的新变量
MiMo-V2-Flash的发布在国内外开发者社区引发热议。其"超绝性价比"和"代码全球最强"的定位,直接挑战了DeepSeek-V3.2、Kimi-K2等开源头部模型。性能评测显示,其综合性能基本与DeepSeek-V3.2相当,仅在"人类最后一场考试"和ARENA-HARD创意文本生成中略逊,但时延更小。
小米将AI能力与其"人车家全生态"深度绑定,罗福莉"从语言迈向物理世界"的愿景,暗示这款模型未来将在小米汽车、智能家居、手机等终端发挥核心作用。在AGI竞赛白热化的当下,MiMo-V2-Flash的开源策略无疑为小米赢得了技术影响力与生态伙伴的双重筹码。
六、结论:AGI征途的"小米加速度"
MiMo-V2-Flash不仅是小米技术实力的集中展示,更是其AI战略从追赶转向引领的标志性产品。通过开源、极速、低成本的三重优势,小米正在构建一个开放、高效的AI开发者生态。罗福莉团队的首秀答卷证明,小米有实力在AGI赛道上跑出"加速度"。未来,随着模型在小米全生态场景的深度融合,"智能从语言迈向物理世界"的愿景或将加速实现。
参考资料与链接:
1. 新浪财经(智东西):《小米突然发布!代码全球最强,总体媲美DeepSeek-V3.2》
https://finance.sina.com.cn/stock/t/2025-12-17/doc-inhcaksr7672666.shtml
(2025-12-17)
2. IT之家:《小米网页AI聊天服务惊喜亮相,MiMo-V2-Flash模型发布》
https://www.ithome.com/0/905/520.htm
(2025-12-16)
3. DoNews:《小米发布新模型MiMo-V2-Flash:媲美DeepSeek-V3.2》
https://www.donews.com/news/detail/1/6311141.html
(2025-12-17)
4. 东方财富网:《小米MiMo-V2-Flash开源》
https://finance.eastmoney.com/a/202512173593932748.html
(2025-12-17)
5. 快科技:《小米自研大模型MiMo-V2-Flash开源上线 卢伟冰:迈向Agent时代的全新语言基座》
https://news.mydrivers.com/1/1092/1092979.htm
(2025-12-17)
6. 每日经济新闻:《小米MiMo-V2-Flash开源》
https://www.nbd.com.cn/articles/2025-12-17/4183917.html
(2025-12-17)
7. 中关村在线:《小米发布开源大模型MiMo-V2-Flash,3090亿参数赋能AI生态》
https://ai.zol.com.cn/1100/11009654.html
(2025-12-17)
8. 网易:《罗福莉加盟小米首战告捷:MiMo-V2-Flash开源,全力冲刺AGI》
https://www.163.com/dy/article/KGVLSE9N0511KIFE.html
(2025-12-17)
留言评论
暂无留言