来源:环球电竞官网 发布时间:2025-06-18 18:14:15
6月17日,沉寂已久的六小龙之一MiniMax酝酿了一个大动作,宣告将接连五天发布重要更新。今天榜首弹是开源首个推理模型MiniMax-M1。
依据官方的陈述,MiniMax-M1多项基准测验比肩DeepSeek-R1、Qwen3等开源模型,挨近海外的最抢先模型。
官方博客还说到,依据两大技能立异,MiniMax-M1练习进程高效得“超出预期”,只用了3周时刻、512块H800 GPU就完结强化学习练习阶段,算力租借本钱仅53.47万美元。这比一开始的预期少了一个数量级。
多位开发者现已榜首时刻打开测评。前illasoft首席技能官@karminski在交际渠道发布了自己对MiniMax-M1的测评,认可其是“开源MoE榜首队伍”。
@karminski侧重测验了MiniMax-M1-80K的写代码才能,用“拆烟囱”这一编程事例实测发现,MiniMax-M1-80K在提示词下一次过,他说到DeepSeek-R1-0528 乃至 Gemini-2.5-Pro 都没能一次经过,这或许得益于其“练习资料满足新”和“考虑时屡次反刍成功避坑”的才能。
缺陷是,从生成的前端页面来看, 款式不是很漂亮,因而用来生成高度构思的内容或许会面对不行发散的问题, 但反过来编程的指令遵从和精确性会更好。别的光影作用不是很好,也是练习缺乏的当地。
也有网友说到,测验发现MiniMax-M1模型中文写作是谨慎优先的,错觉较低,以遵从文本和指令为榜首。这在重视发散的国内模型中比较可贵。
依托这一根底,M1系列在长上下文了解使命中 (MRCR)体现较优,从测验目标看,逾越了一切开源权重模型,乃至逾越海外的顶尖模型OpenAI o3和Claude 4 Opus,全球排名第二,仅弱小距离落后于Gemini 2.5 Pro。
“无限长的长文本才能是MiniMax团队一直在打磨的重要维度,关于做交际运用、情感陪同运用,Agent等来说是很要害的技能。”云启本钱合伙人陈昱在6月的大会论坛上表明。云启是MiniMax的天使轮出资组织。
在代码才能(SWE-bench)上,MiniMax-M1明显逾越大部分开源模型,仅弱小距离次于DeepSeek最新发布的R1。
MiniMax表明,MiniMax-M1的长文本才能得益于闪电注意力机制为主的混合架构,这一架构使得M1在进行长文本的上下文输入和深度推理时均有算力功率优势。MiniMax举例称,在用8万Token深度推理的时分,只需要用DeepSeek R1约30%的算力。
除此之外,MiniMax提出的另一立异是强化学习算法CISPO。官方博客表明,在数学AIME的试验中,这比字节近期提出的 DAPO 等强化学习算法收敛功能快了一倍,明显优于 DeepSeek前期运用的 GRPO。这也是终究算力本钱不到54万美元的原因。
由于相对高效的练习和推理算力运用,MiniMax的定价性价比较高,官方直接对标性价比之王DeepSeek喊话,“两种形式都比 DeepSeek-R1 性价比更高,另一种形式DeepSeek模型不支持。”
简直与MiniMax一起,六小龙之中的别的一家月之暗面也在今天开源了编程模型 Kimi-Dev-72B。依据官方发布的信息,这一模型是依据阿里云的Qwen2.5-72B 微调得到的。依据陈述,这一模型在SWE-bench编程基准测验中获得了全球最高开源模型水平,成果超过了新版DeepSeek-R1。
这引发了对其高分是否源于“过拟合”的质疑,这是机器学习中的遍及的问题,指模型在练习集上体现优异,但在未见过的新数据上猜测才能明显下降。现在月之暗面没有发布具体技能陈述。
DeepSeek在年头搅动风暴后,AI六小龙有的呈现高管出走风云,有的沉寂已久,静心练习半年,看起来这些厂商现已做好了新的预备,持续参加这场大模型之争中。
MiniMax预告,后续四天将有更多更新。此前“海螺02(0616)”视频模型已现身AI视频竞技场,并获得第二名的佳绩,业界遍及预期海螺新版本行将正式露脸。假如海螺能连续M1在本钱或才能上的打破,或将进一步搅动多模态AI的格式。