
回复
昨天科技圈被小米的一条重磅消息刷屏了——全球首个专为推理设计的大型开源模型 Xiaomi MiMo 正式亮相!更令人震惊的是,这个仅 70亿参数 的小模型,在数学推理(AIME24-25)和代码竞赛(LiveCodeBench v5)测评中,直接碾压了OpenAI闭源的 o1-mini 和阿里开源的 QwQ-32B-Preview。
在DeepSeek-R1掀起强化学习(RL)热潮的当下,小米用MiMo-7B交出了一份惊艳答卷:
数学推理:AIME24-25测试中,MiMo解题准确率远超同赛道选手,甚至能处理复杂微积分和几何证明;代码能力:LiveCodeBench v5竞赛级题目中,它生成的代码逻辑严谨,调试效率直逼人类工程师:
能以小模型搏大场面,背后是小米AI团队的两板斧:
在预训练阶段,小米合成了海量数学论文、编程题库和逻辑谜题,通过三阶段渐进式训练(从简单到复杂),让模型啃透25T tokens的“推理硬菜”。而在后训练阶段,则通过强化学习优化效果:
小米这次不玩“闭源炫技”,而是直接把MiMo全系列模型扔上了HuggingFace(链接见文末),开发者可免费商用。
小米的野心:AGI长征才刚开始
尽管MiMo-7B已展现惊人潜力,但小米清醒地表示:2025年只是大模型下半场的起点,AGI之路道阻且长。不过,从手机到汽车再到AI,这家公司正用实际行动证明——中国科技企业,完全能在基础模型层面与全球巨头掰手腕。