来自 科技2025-06-17 17:00:49
【导语】6月17日,上海AI独角兽MiniMax宣布开源其推理模型MiniMax-M1,标志着全球首个开放权重的大规模混合注意力推理模型面世。M1结合混合门控专家架构与Lightning Attention技术,在长上下文理解、代码生成等场景中表现卓越,接近顶尖闭源系统水平。同时,M1在算力成本上实现显著降低,展现出高效推理能力。此次开源不仅填补了长上下文技术的空白,更以“开源+场景化”战略打破技术垄断,为国产大模型实用化树立新典范。
6月17日,上海AI独角兽MiniMax正式开源推理模型MiniMax-M1(以下简称“M1”)。MiniMax称,这是全球首个开放权重的大规模混合注意力推理模型。凭借混合门控专家架构(Mixture-of-Experts,MoE)与 Lightning Attention 的结合,M1在性能表现和推理效率方面实现了显著突破。实测数据显示,M1系列在长上下文理解、代码生成等生产力场景中超越多数闭源模型,仅微弱差距落后于顶尖闭源系统。

开源报告截图 来源:MiniMax提供
M1支持目前业内最高100万token上下文输入,同时支持最多8万token输出。成本表现方(fāng)面(miàn),在(zài)进(jìn)行(xíng)8万(wàn)Token的(de)深(shēn)度(dù)推(tuī)理(lǐ)时(shí),M1所(suǒ)需(xū)的(de)算(suàn)力(lì)仅(jǐn)为(wèi)DeepSeek R1的(de)约(yuē)30%;生(shēng)成(chéng)10万(wàn)token时(shí),推(tuī)理(lǐ)算(suàn)力(lì)只(zhǐ)需(xū)要(yào)DeepSeek R1的(de)25%。MiniMax表(biǎo)示(shì),M1整(zhěng)个(gè)强(qiáng)化(huà)学(xué)习阶段只用到512块H800三周时间,租赁成本为53.74万美元。
天使投资人、资深人工智能专家郭涛向澎湃科技(www.thepaper.cn)分析认为,目前国内大模型市场格局早已形成,大模型竞争不仅仅是技术的竞争,而是算力、数据、应用场景等整个生态的竞争。此次MiniMax更新填补了开源领域长上下文技术的空白,更以“开源+场景化”路径打破技术垄断,为国产大模型迈向实用化树立新标杆。