MiniMax发布推理模型对标DeepSeek算力本钱仅约53万美元_行业知识_环球电竞官网首页

MiniMax发布推理模型对标DeepSeek算力本钱仅约53万美元

来源：环球电竞官网发布时间：2025-06-18 18:14:15

6月17日，沉寂已久的六小龙之一MiniMax酝酿了一个大动作，宣告将接连五天发布重要更新。今天榜首弹是开源首个推理模型MiniMax-M1。

依据官方的陈述，MiniMax-M1多项基准测验比肩DeepSeek-R1、Qwen3等开源模型，挨近海外的最抢先模型。

官方博客还说到，依据两大技能立异，MiniMax-M1练习进程高效得“超出预期”，只用了3周时刻、512块H800 GPU就完结强化学习练习阶段，算力租借本钱仅53.47万美元。这比一开始的预期少了一个数量级。

多位开发者现已榜首时刻打开测评。前illasoft首席技能官@karminski在交际渠道发布了自己对MiniMax-M1的测评，认可其是“开源MoE榜首队伍”。

@karminski侧重测验了MiniMax-M1-80K的写代码才能，用“拆烟囱”这一编程事例实测发现，MiniMax-M1-80K在提示词下一次过，他说到DeepSeek-R1-0528 乃至 Gemini-2.5-Pro 都没能一次经过，这或许得益于其“练习资料满足新”和“考虑时屡次反刍成功避坑”的才能。

缺陷是，从生成的前端页面来看, 款式不是很漂亮，因而用来生成高度构思的内容或许会面对不行发散的问题, 但反过来编程的指令遵从和精确性会更好。别的光影作用不是很好，也是练习缺乏的当地。

也有网友说到，测验发现MiniMax-M1模型中文写作是谨慎优先的，错觉较低，以遵从文本和指令为榜首。这在重视发散的国内模型中比较可贵。

依托这一根底，M1系列在长上下文了解使命中 (MRCR)体现较优，从测验目标看，逾越了一切开源权重模型，乃至逾越海外的顶尖模型OpenAI o3和Claude 4 Opus，全球排名第二，仅弱小距离落后于Gemini 2.5 Pro。

“无限长的长文本才能是MiniMax团队一直在打磨的重要维度，关于做交际运用、情感陪同运用，Agent等来说是很要害的技能。”云启本钱合伙人陈昱在6月的大会论坛上表明。云启是MiniMax的天使轮出资组织。

在代码才能（SWE-bench）上，MiniMax-M1明显逾越大部分开源模型，仅弱小距离次于DeepSeek最新发布的R1。

MiniMax表明，MiniMax-M1的长文本才能得益于闪电注意力机制为主的混合架构，这一架构使得M1在进行长文本的上下文输入和深度推理时均有算力功率优势。MiniMax举例称，在用8万Token深度推理的时分，只需要用DeepSeek R1约30%的算力。

除此之外，MiniMax提出的另一立异是强化学习算法CISPO。官方博客表明，在数学AIME的试验中，这比字节近期提出的 DAPO 等强化学习算法收敛功能快了一倍，明显优于 DeepSeek前期运用的 GRPO。这也是终究算力本钱不到54万美元的原因。

由于相对高效的练习和推理算力运用，MiniMax的定价性价比较高，官方直接对标性价比之王DeepSeek喊话，“两种形式都比 DeepSeek-R1 性价比更高，另一种形式DeepSeek模型不支持。”

简直与MiniMax一起，六小龙之中的别的一家月之暗面也在今天开源了编程模型 Kimi-Dev-72B。依据官方发布的信息，这一模型是依据阿里云的Qwen2.5-72B 微调得到的。依据陈述，这一模型在SWE-bench编程基准测验中获得了全球最高开源模型水平，成果超过了新版DeepSeek-R1。

这引发了对其高分是否源于“过拟合”的质疑，这是机器学习中的遍及的问题，指模型在练习集上体现优异，但在未见过的新数据上猜测才能明显下降。现在月之暗面没有发布具体技能陈述。

DeepSeek在年头搅动风暴后，AI六小龙有的呈现高管出走风云，有的沉寂已久，静心练习半年，看起来这些厂商现已做好了新的预备，持续参加这场大模型之争中。

MiniMax预告，后续四天将有更多更新。此前“海螺02（0616）”视频模型已现身AI视频竞技场，并获得第二名的佳绩，业界遍及预期海螺新版本行将正式露脸。假如海螺能连续M1在本钱或才能上的打破，或将进一步搅动多模态AI的格式。

上一篇:姑苏东菱振荡实验仪器获得一种大推力振荡台动圈粘结状况监测办法及动圈结构专利

环球电竞官网是环境试验设备研发生产厂家

造客户最满意环境试验设备

咨询热线

18665599479

MiniMax发布推理模型对标DeepSeek算力本钱仅约53万美元

相关新闻

新闻中心

相关新闻

推荐产品