国内大模型竞逐MoE技术高地 科大讯飞推出业界首个国产算力训推方案

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!   大模型训练的高成本始终是行业痛点,而混合专家模型(MoE)因其“稀疏激活”特性成为降本增效的关...

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

  大模型训练的高成本始终是行业痛点,而混合专家模型(MoE)因其“稀疏激活”特性成为降本增效的关键路径。随着DeepSeek R1开源引爆技术热潮,字节、阿里以及科大讯飞等国内主流大模型企业纷纷加码MoE架构创新,从通信优化到国产算力适配,一场围绕效率与生态的竞逐赛已然展开。

  3月1日,DeepSeek发布了“开源周”后的“彩蛋”,首次公布了模型降本增效的技术细节以及理论上高达545%的利润率。“彩蛋”显示,DeepSeek的671B参数模型在处理每个问题时,实际被激活的专家模型参数仅约37B,算力需求降低至传统架构的约二十分之一。

国内大模型竞逐MoE技术高地 科大讯飞推出业界首个国产算力训推方案

  MoE架构虽然能有效降低算力消耗,但在分布式训练过程中,仍然面临着跨设备通信开销巨大的挑战。有鉴于此,字节跳动豆包大模型团队于3月10日推出了针对MoE架构的通信优化系统COMET。据介绍,该系统采用细粒度计算与通信重叠技术,在大规模MoE模型上实现了单层1.96倍的加速效果,端到端平均效率也提升了1.71倍。

  在这场技术角逐中,另一互联网巨头阿里巴巴也通过开源策略持续扩大声量。3月6日,阿里云发布并开源了全新的推理模型通义千问QwQ-32B。阿里云称,该模型采用密集架构(Dense),尽管参数仅为32B,但性能却能与满血版DeepSeek R1这类混合专家模型(MoE)相媲美。

  诚然,DeepSeek等国产大型模型在算法上实现了诸多引领行业的创新,并且都选择了开源,但它们背后所依赖的仍然是英伟达提供的强大算力。而作为发布国内唯一基于全国产化算力训推大模型的企业,科大讯飞则始终将重心放在国产算力的创新突破上。

  近日,科大讯飞与华为在国产算力领域取得重大进展,双方联合团队率先突破国产算力集群上MoE模型的大规模跨节点专家并行集群推理,这是继DeepSeek公布其MoE模型训练推理方案后,业界首个基于国产算力的全新解决方案。

  通过算子融合、混合并行策略和通信计算并行优化等一系列创新,科大讯飞在国产算力上实现了显著性能提升:单卡静态内存占用缩减至双机部署的1/4,效率提升75%,专家计算密度增加4倍,推理吞吐提升3.2倍,端到端时延降低50%。科大讯飞称,这一解决方案将应用于讯飞星火深度推理模型X1的训练加速,预期训练时推理效率将提升200%。

  从DeepSeek点燃开源之火,到字节、阿里争相技术共享,再到科大讯飞实现国产算力突破,国内MoE赛道已形成“效率迭代”与“自主可控”的双重叙事。开源模式虽对企业直接创收有影响,却能通过生态共建降低研发成本、扩大市场份额;而国产算力突破则关乎技术主权与供应链安全,在AI基础设施竞争白热化的当下,战略意义同样毋庸置疑。

本文来自作者[合文科]投稿,不代表酷展号立场,如若转载,请注明出处:https://iosku.vip/shenghe/2025sop04-4943.html

(21)

文章推荐

  • 尾盘拉升,A股韧性凸显

      A股凸显韧性。  隔夜美股大跌,受此影响,今天早盘A股三大股指低开,上证指数跌近1%,深证成指、创业板指均跌超1%。临近收盘,三大指数先后翻红。截至收盘,上证指数上涨0.41%,深证成指上涨0.33%,创业板指上涨0.19%。  大消费板块今天表现活跃,美容护理、白酒、旅游酒店、食品加工等

    2025年03月11日
    22
  • 旗下社交平台X服务中断 马斯克称“遭遇来自乌克兰的网络攻击”

      周一早些时候,埃隆・马斯克的社交平台X遭遇了多轮服务中断。这位亿万富翁声称,这是一起源于乌克兰的网络攻击所致。   “我们不太确定具体发生了什么,”马斯克在当地时间周一下午接受采访时表示,“但当时发生了一场大规模的网络攻击,试图让X系统瘫痪,攻击的IP地址来自乌克兰地区(Ukraineare

    2025年03月11日
    28
  • 白酒国际化打开成长空间!吃喝板块震荡回调,食品ETF(515710)收跌0.79%!短期承压不改长期逻辑?

      今日(3月12日),吃喝板块震荡回调。反映吃喝板块整体走势的食品ETF(515710)开盘小幅上扬后迅速走弱,后全天维持低位震荡,截至收盘,场内价格跌0.79%。  成份股方面,白酒全线走弱。截至收盘,水井坊跌2.06%,五粮液、山西汾酒、洋河股份、今世缘等跌超1%,贵州茅台、泸州老窖、舍得

    2025年03月13日
    22
  • 拉加德警告:贸易战将造成严重后果,欧盟只能对美国进行反制

      欧洲央行行长拉加德警告,特朗普挑起的关税争端加剧可能对全球经济产生不利影响。  “如果我们真打一场贸易战,贸易将受到严重抑制,那将产生严重后果,”她表示。“对全球增长和物价都会造成影响,尤其是美国。”  拉加德在采访中称,特朗普的“决定以及反复让人担忧,需要我们保持高度警惕”。这“引发了我们

    2025年03月14日
    21
  • 西安疫情最新报道西安疫情最新报道今天

    大家好,今天小编关注到一个比较有意思的话题,就是关于西安疫情最新报道的问题,于是小编就整理了4个相关介绍西安疫情最新报道的解答,让我们一起看看吧。西安昨日新增155例确诊,到底是什么原因让西安疫情如此严重?人在西安,封城第四天。昨天第三次全员核检,确诊病例新高,新增‬西安市155例,咸阳市2例中,拐

    2025年03月26日
    25
  • 上海昨日新增9例本土确诊上海昨日新增疫情

    大家好,今天小编关注到一个比较有意思的话题,就是关于上海昨日新增9例本土确诊的问题,于是小编就整理了2个相关介绍上海昨日新增9例本土确诊的解答,让我们一起看看吧。上海报告6例本土确诊病例,还能不能去医院看病?这话问得:看仔细:哪一例是上海人?上海人是全中国最自律的,再去上海医院看看,是上海市人多,还

    2025年03月30日
    21
  • 网页制作平台(在线视频编辑 这个网站超好用)

    现在很多小伙伴会时不时做个简单视频,不管是当up主还是小范围分享,都需要方便给力的视频编辑工具,视频平台的工具简单直观,但只为单一平台优化;专业半专业的PC平台视频编辑软件功能全但大都复杂昂贵;手机上的免费软件自拍自作最方便,可是屏幕太小不好操作。想要综合它们的优点,我们不妨试试在线平台秀展网吧。打

    2025年03月31日
    18
  • 欧冠决赛2014(开启王朝的第一冠皇马加时赛41击败马竞)

    视频加载中...2014年欧冠决赛,上演了难得一见的马德里德比。最终,皇马加时赛连进3球击败马竞,拿下欧冠冠军。

    2025年04月05日
    16
  • 专科分数(专科院校录取最低控制线公布→)

    山西省招考中心公布我省今年普通高校招生高本贯通、提前专科(高职)专科(高职)院校录取最低控制分数线高本贯通院校录取最低控制分数线为:文史类407分;理工类377分。艺术类文化成绩最低控制分数线为:艺术(文)305分;艺术(理)283分。艺术类专业须取得相应科类专业统考成绩。提前专科(高职)批、专科(

    2025年04月13日
    16
  • 南方航空,或考虑分拆货运业务「南航物流」在香港上市

    登录新浪财经APP搜索【信披】查看更多考评等级  来源:瑞恩资本RyanbenCapital  彭博引述消息人土报道,南方航空(01055.HK)正在考虑分拆货运业务(南航物流)在香港上市,集资至少数亿美元。  南方航空此前计划将南航物流分拆在上海交易所主板上市,但于2月份时因场环境变化,

    2025年04月16日
    13

发表回复

本站作者后才能评论

评论列表(4条)

  • 合文科
    合文科 2025年04月26日

    我是酷展号的签约作者“合文科”!

  • 合文科
    合文科 2025年04月26日

    希望本篇文章《国内大模型竞逐MoE技术高地 科大讯飞推出业界首个国产算力训推方案》能对你有所帮助!

  • 合文科
    合文科 2025年04月26日

    本站[酷展号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • 合文科
    合文科 2025年04月26日

    本文概览:  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!   大模型训练的高成本始终是行业痛点,而混合专家模型(MoE)因其“稀疏激活”特性成为降本增效的关...

    联系我们

    邮件:酷展号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们