MiniMax发布开源混合架构推理模型M1

来自科技2025-06-17 17:00:49

【导语】6月17日，上海AI独角兽MiniMax宣布开源其推理模型MiniMax-M1，标志着全球首个开放权重的大规模混合注意力推理模型面世。M1结合混合门控专家架构与Lightning Attention技术，在长上下文理解、代码生成等场景中表现卓越，接近顶尖闭源系统水平。同时，M1在算力成本上实现显著降低，展现出高效推理能力。此次开源不仅填补了长上下文技术的空白，更以“开源+场景化”战略打破技术垄断，为国产大模型实用化树立新典范。

6月17日，上海AI独角兽MiniMax正式开源推理模型MiniMax-M1（以下简称“M1”）。MiniMax称，这是全球首个开放权重的大规模混合注意力推理模型。凭借混合门控专家架构（Mixture-of-Experts，MoE）与 Lightning Attention 的结合，M1在性能表现和推理效率方面实现了显著突破。实测数据显示，M1系列在长上下文理解、代码生成等生产力场景中超越多数闭源模型，仅微弱差距落后于顶尖闭源系统。

开源报告截图来源：MiniMax提供

M1支持目前业内最高100万token上下文输入，同时支持最多8万token输出。成本表现方(fāng)面(miàn)，在(zài)进(jìn)行(xíng)8万(wàn)Token的(de)深(shēn)度(dù)推(tuī)理(lǐ)时(shí)，M1所(suǒ)需(xū)的(de)算(suàn)力(lì)仅(jǐn)为(wèi)DeepSeek R1的(de)约(yuē)30%；生(shēng)成(chéng)10万(wàn)token时(shí)，推(tuī)理(lǐ)算(suàn)力(lì)只(zhǐ)需(xū)要(yào)DeepSeek R1的(de)25%。MiniMax表(biǎo)示(shì)，M1整(zhěng)个(gè)强(qiáng)化(huà)学(xué)习阶段只用到512块H800三周时间，租赁成本为53.74万美元。

天使投资人、资深人工智能专家郭涛向澎湃科技（www.thepaper.cn）分析认为，目前国内大模型市场格局早已形成，大模型竞争不仅仅是技术的竞争，而是算力、数据、应用场景等整个生态的竞争。此次MiniMax更新填补了开源领域长上下文技术的空白，更以“开源+场景化”路径打破技术垄断，为国产大模型迈向实用化树立新标杆。