小米发布MiMo-V2-Flash大模型：开源、极速、剑指AGI新高度

2025/12/17 11:44 科技频道阅读：735 评论：0

2025年12月17日，在年度"人车家全生态合作伙伴大会"前夕，小米集团正式推出其自研的超大参数规模语言模型MiMo-V2-Flash，并宣布以MIT协议全面开源。这款总参数高达3090亿、激活参数150亿的MoE架构模型，不仅在代码能力上创下开源模型新纪录，更以极致的推理速度和极具竞争力的成本，向全球开发者社区抛出橄榄枝。这是前DeepSeek-V2核心开发者罗福莉加盟小米后的首秀之作，也是小米在AGI征途上的关键落子。

一、发布背景：小米AI战略的关键一跃

1.1 战略时间节点

12月17日，小米选择在其年度生态大会当天发布MiMo-V2-Flash，彰显其在AI基础设施层的雄心。小米集团总裁卢伟冰在大会主题演讲中，将这款模型定义为 "迈向Agent时代的全新语言基座" 。根据小米公布的AI路线图，MiMo-V2-Flash是MiMo系列的重要里程碑，此前已布局MiMo-7B、MiMo-VL视觉模型、MiMo-Audio音频模型等全线产品。

1.2 人才投入与资源倾斜

此次发布背后是小米持续加码的AI投入。卢伟冰透露，过去四个季度公司AI投入环比增速超50%，并启动全球人才招募，单岗位薪酬上限达千万元。而统领这一项目的，正是11月12日刚刚官宣加盟的前DeepSeek-V2核心开发者罗福莉。这位在北京师范大学本科、北京大学计算语言学硕士毕业的AI专家，曾任职阿里达摩院，后深度参与DeepSeek-V2开发。她在朋友圈写道："智能终将从语言迈向物理世界"，暗示小米AI将深度融入其硬件生态。

二、技术规格：参数规模与架构创新

2.1 基础参数

MiMo-V2-Flash采用MoE（Mixture of Experts）架构，总参数量达到 309B（3090亿），激活参数量为 15B（150亿）。这一规模使其跻身当前开源大模型第一梯队，与DeepSeek-V3.2、Kimi-K2等头部模型直接竞争。

2.2 上下文与速度

模型提供256k的上下文窗口，原生支持32K并外扩至256K训练，能够完成数百轮Agent交互和复杂工具调用任务。其最引人注目的特性是每秒150个token的推理速度，响应延迟显著优于同类模型。

2.3 定价策略

在API定价上，小米展现了极致的性价比：

输入：0.7元/百万tokens（约0.1美元）

输出：2.1元/百万tokens（约0.3美元）

这一价格仅为Claude Sonnet 4.5的2.5%，且目前API处于限时免费阶段。

三、核心亮点：代码能力与推理效率双突破

3.1 代码能力：超越所有开源模型

MiMo-V2-Flash最引以为傲的是其代码能力。在权威的SWE-bench Verified基准测试中，该模型得分高达73.4%，超越所有开源模型，直逼GPT-5-High，与闭源标杆Claude Sonnet 4.5并肩。这一测试要求AI修复真实世界的软件bug，73.4%的成功率意味着它能搞定大部分实际编程问题。

在多语言编程测试SWE-Bench Multilingual中，其解决率达到71.7%。用户实测显示，它能一键生成功能齐全的HTML网页，并与Claude Code、Cursor、Cline等主流编码框架无缝协同。

3.2 推理与Agent能力

模型专为推理、编码和Agent场景构建，支持混合思维模式，允许用户自由切换"深度思考"与"即时回答"。在多项基准测试中表现优异：

AIME 2025数学竞赛：位列开源模型前两名

GPQA-Diamond科学知识测试：位列开源模型前两名

τ²-Bench智能体任务：通信类95.3分、零售类79.5分、航空类66.0分

BrowseComp搜索代理：启用上下文管理后得分从45.4提升至58.3

3.3 架构创新：速度与内存的双重优化

技术报告披露了两项关键创新：

1. 5:1混合注意力机制：采用Global Attention与Sliding Window Attention（SWA）混合结构，将KV缓存存储量减少近6倍

2. 多词元预测模块（MTP）：使推理速度提升2至2.6倍

这些激进的设计让MiMo-V2-Flash在保持高性能的同时，实现了极致的效率。

四、全面开源：开发者生态的诚意之作

4.1 开源范围

小米此次展现了极大的开源诚意：

模型权重：已在Hugging Face发布

推理代码：向SGLang开发者社区贡献全部代码

技术报告：完整论文公开在GitHub

协议：采用MIT开源协议，允许商业使用

4.2 体验渠道

开发者与用户可通过以下方式体验：

Web Demo：Xiaomi MiMO Studio（https://aistudio.xiaomimimo.com）

GitHub仓库：https://github.com/xiaomimimo/MiMo-V2-Flash

Hugging Face：https://hf.co/XiaomiMiMo/MiMo-V2-Flash

开放平台：https://platform.xiaomimimo.com/

五、行业影响：开源生态的新变量

MiMo-V2-Flash的发布在国内外开发者社区引发热议。其"超绝性价比"和"代码全球最强"的定位，直接挑战了DeepSeek-V3.2、Kimi-K2等开源头部模型。性能评测显示，其综合性能基本与DeepSeek-V3.2相当，仅在"人类最后一场考试"和ARENA-HARD创意文本生成中略逊，但时延更小。

小米将AI能力与其"人车家全生态"深度绑定，罗福莉"从语言迈向物理世界"的愿景，暗示这款模型未来将在小米汽车、智能家居、手机等终端发挥核心作用。在AGI竞赛白热化的当下，MiMo-V2-Flash的开源策略无疑为小米赢得了技术影响力与生态伙伴的双重筹码。

六、结论：AGI征途的"小米加速度"

MiMo-V2-Flash不仅是小米技术实力的集中展示，更是其AI战略从追赶转向引领的标志性产品。通过开源、极速、低成本的三重优势，小米正在构建一个开放、高效的AI开发者生态。罗福莉团队的首秀答卷证明，小米有实力在AGI赛道上跑出"加速度"。未来，随着模型在小米全生态场景的深度融合，"智能从语言迈向物理世界"的愿景或将加速实现。

参考资料与链接：

1. 新浪财经（智东西）：《小米突然发布！代码全球最强，总体媲美DeepSeek-V3.2》

https://finance.sina.com.cn/stock/t/2025-12-17/doc-inhcaksr7672666.shtml

（2025-12-17）

2. IT之家：《小米网页AI聊天服务惊喜亮相，MiMo-V2-Flash模型发布》

https://www.ithome.com/0/905/520.htm

（2025-12-16）

3. DoNews：《小米发布新模型MiMo-V2-Flash：媲美DeepSeek-V3.2》

https://www.donews.com/news/detail/1/6311141.html

（2025-12-17）

4. 东方财富网：《小米MiMo-V2-Flash开源》

https://finance.eastmoney.com/a/202512173593932748.html

（2025-12-17）

5. 快科技：《小米自研大模型MiMo-V2-Flash开源上线卢伟冰：迈向Agent时代的全新语言基座》

https://news.mydrivers.com/1/1092/1092979.htm

（2025-12-17）

6. 每日经济新闻：《小米MiMo-V2-Flash开源》

https://www.nbd.com.cn/articles/2025-12-17/4183917.html

（2025-12-17）

7. 中关村在线：《小米发布开源大模型MiMo-V2-Flash，3090亿参数赋能AI生态》

https://ai.zol.com.cn/1100/11009654.html

（2025-12-17）

8. 网易：《罗福莉加盟小米首战告捷：MiMo-V2-Flash开源，全力冲刺AGI》

https://www.163.com/dy/article/KGVLSE9N0511KIFE.html

（2025-12-17）

上一篇吐槽一下CSDN开通VIP才能阅读全文下一篇单点登录（SSO）全面解析

小米发布MiMo-V2-Flash大模型：开源、极速、剑指AGI新高度

留言评论

最新文章

网站开发必看：5款实用富文本编辑器推荐，新手也能快速上手

阿里发布通义万相2.6：国内首个角色扮演视频模型来了！人人能当导演

单点登录（SSO）全面解析

小米发布MiMo-V2-Flash大模型：开源、极速、剑指AGI新高度

吐槽一下CSDN开通VIP才能阅读全文

热评文章

吐槽一下CSDN开通VIP才能阅读全文

4K HDR超高清 50FPS《纪念中国人民抗日战争暨世界反法西斯战争胜利80周年大会》完整版

新华社评论员：铭记历史警示凝聚复兴伟力

解决使用Thinkphp captcha验证码不显示问题

小米发布MiMo-V2-Flash大模型：开源、极速、剑指AGI新高度