首页 - 互联网

国内大模型竞争聚焦MoE技术，科大讯飞发布首个国产算力训推方案

作者: 五速梦信息网
时间: 2026年04月01日 11:05

国内大模型竞逐MoE技术高地，科大讯飞推出业界首个国产算力训推方案

MoE架构：降本增效的关键路径

大模型的训练成本一直是行业发展的痛点，而混合专家模型（MoE）因其独特的“稀疏激活”特性，成为解决这一问题的重要技术方向。近期，随着DeepSeek R1开源引发的技术热潮，字节跳动、阿里巴巴以及科大讯飞等国内主流大模型企业纷纷加码MoE架构创新。从通信优化到国产算力适配，一场围绕效率与生态的竞争正在悄然展开。

DeepSeek的突破：理论利润率高达545%

3月初，DeepSeek发布了一项令人瞩目的技术细节，展示了其在模型降本增效方面的显著成果。通过MoE架构，DeepSeek的671B参数模型在处理每个问题时，实际被激活的专家模型参数仅约37B，这意味着算力需求降低至传统架构的二十分之一。这一技术突破不仅大幅降低了训练和推理成本，还为行业提供了高达545%的理论利润率，展现了巨大的商业潜力。

字节跳动的通信优化方案：COMET系统

面对MoE架构在分布式训练中跨设备通信开销巨大的挑战，字节跳动旗下的豆包大模型团队于3月10日推出了一款名为COMET的通信优化系统。该系统通过细粒度计算与通信重叠技术，在大规模MoE模型上实现了单层1.96倍的加速效果，端到端平均效率也提升了1.71倍。这一技术进步为MoE模型的大规模应用铺平了道路，同时也体现了字节跳动在技术创新上的持续投入。

阿里巴巴的开源策略：通义千问QwQ-32B

与此同时，阿里巴巴也在通过开源策略扩大其在MoE领域的影响力。3月6日，阿里云发布了全新的推理模型通义千问QwQ-32B，并将其开源。尽管该模型采用的是密集架构（Dense），参数仅为32B，但其性能却能媲美像DeepSeek R1这样的混合专家模型（MoE）。这种以小博大的设计思路，不仅展现了阿里巴巴在算法优化上的深厚功底，也为行业提供了一个高效且经济的解决方案。

科大讯飞的国产算力突破：自主可控的新篇章

值得注意的是，虽然DeepSeek等企业在算法层面实现了诸多创新，但这些技术大多依赖英伟达提供的强大算力支持。相比之下，科大讯飞则将重心放在了国产算力的创新突破上。近日，科大讯飞与华为联合团队在国产算力集群上成功实现了MoE模型的大规模跨节点专家并行集群推理。这是业界首个基于国产算力的全新解决方案，标志着我国在AI基础设施领域迈出了重要一步。

通过一系列技术创新，如算子融合、混合并行策略和通信计算并行优化，科大讯飞在国产算力上实现了显著的性能提升：单卡静态内存占用缩减至双机部署的四分之一，效率提升75%，专家计算密度增加4倍，推理吞吐量提升3.2倍，端到端时延降低50%。这些成果将直接应用于讯飞星火深度推理模型X1的训练加速，预计训练时的推理效率将提升200%。

开源与自主可控：双重叙事下的行业趋势

从DeepSeek点燃开源之火，到字节跳动、阿里巴巴争相技术共享，再到科大讯飞实现国产算力突破，国内MoE赛道已经形成了“效率迭代”与“自主可控”的双重叙事。开源模式虽然可能对企业的直接创收产生一定影响，但通过生态共建，可以有效降低研发成本，扩大市场份额。而国产算力的突破，则关乎技术主权与供应链安全，在当前AI基础设施竞争日益激烈的背景下，其战略意义不言而喻。