周末,DeepSeek扔出“王炸”首次披露了成本利润率 影响多大?

  周六,国内AI大模型公司DeepSeek官方账号在知乎首次发布《DeepSeek-V3/R1推理系统概览》技术文章,不仅公开了其推理系统的核心优化方案,更是首次披露了成本利...

  周六,国内AI大模型公司DeepSeek官方账号在知乎首次发布《DeepSeek-V3/R1推理系统概览》技术文章,不仅公开了其推理系统的核心优化方案,更是首次披露了成本利润率等关键数据,引发行业震动。

  数据显示,若按理论定价计算,其单日成本利润率高达545%,这一数字刷新了全球AI大模型领域的盈利天花板。

  业内分析指出,DeepSeek的开源策略与成本控制能力正在打破AI领域的资源垄断。DeepSeek此次“透明化”披露,不仅展示了其技术实力与商业潜力,更向行业传递明确信号:AI大模型的盈利闭环已从理想照进现实。

  DeepSeek最新发布

  3月1日,DeepSeek于知乎开设官方账号,发布《DeepSeek-V3/R1推理系统概览》技术文章,首次公布模型推理系统优化细节,并披露成本利润率关键信息。

  文章写道:“DeepSeek-V3/ R1推理系统的优化目标是:更大的吞吐,更低的延迟。”

  为实现这两个目标,DeepSeek的方案是使用大规模跨节点专家并行(EP),但该方案也增加了系统复杂性。文章的主要内容就是关于如何使用EP增长批量大小(batch size)、隐藏传输耗时以及进行负载均衡。

  值得注意的是,文章还率先披露了DeepSeek的理论成本和利润率等关键信息。

  根据DeepSeek官方披露,DeepSeek V3和R1的所有服务均使用H800 GPU,使用和训练一致的精度,即矩阵计算和dispatch 传输采用和训练一致的FP8格式,core-attention计算和combine传输采用和训练一致的BF16,最大程度保证了服务效果。

  另外,由于白天的服务负荷高,晚上的服务负荷低,因此DeepSeek实现了一套机制,在白天负荷高的时候,用所有节点部署推理服务。晚上负荷低的时候,减少推理节点,以用来做研究和训练。

  在最近24小时(2025年2月27日12:00至28日12:00)的统计周期内:GPU租赁成本按2美元/小时计算,日均成本为87072美元;若所有输入/输出token按R1定价(输入1元/百万token、输出16元/百万token)计算,单日收入可达562027美元,成本利润率高达545%。

周末,DeepSeek扔出“王炸”首次披露了成本利润率 影响多大?

  不过,DeepSeek官方坦言,实际上没有这么多收入,因为V3的定价更低,同时收费服务只占了一部分,另外夜间还会有折扣。

  DeepSeek的高利润率源于其创新的推理系统设计,核心包括大规模跨节点专家并行(EP)、计算通信重叠与负载均衡优化三大技术支柱:专家并行(EP)提升吞吐与响应速度,针对模型稀疏性(每层仅激活8/256个专家),采用EP策略扩展总体批处理规模(batch size),确保每个专家获得足够的计算负载,显著提升GPU利用率;部署单元动态调整(如Prefill阶段4节点、Decode阶段18节点),平衡资源分配与任务需求。

  计算与通信重叠隐藏延迟,Prefill阶段通过“双batch交错”实现计算与通信并行,Decode阶段拆分attention为多级流水线,最大限度掩盖通信开销。

  全局负载均衡避免资源浪费,针对不同并行模式(数据并行DP、专家并行EP)设计动态负载均衡器,确保各GPU的计算量、通信量及KVCache占用均衡,避免节点空转。

  简单来说,EP就像是“多人协作”,把模型中的“专家”分散到多张GPU上进行计算,大幅提升Batch Size,榨干GPU算力,同时专家分散,降低内存压力,更快响应。

  DeepSeek在工程层面进一步压缩成本。昼夜资源调配:白天高峰时段全力支持推理服务,夜间闲置节点转用于研发训练,最大化硬件利用率;缓存命中率达56.3%:通过KVCache硬盘缓存减少重复计算,在输入token中,有3420亿个(56.3%)直接命中缓存,大幅降低算力消耗。

  影响多大?

  有分析称,DeepSeek此次披露的数据,不仅验证了其技术路线的商业可行性,更为行业树立了高效盈利的标杆:其模型训练成本仅为同类产品的1%—5%,此前发布的DeepSeek-V3模型训练成本仅557.6万美元,远低于OpenAI等巨头;推理定价优势方面,DeepSeek-R1的API定价仅为OpenAI o3-mini的1/7至1/2,低成本策略加速市场渗透。

  业内分析指出,DeepSeek的开源策略与成本控制能力正在打破AI领域的资源垄断。DeepSeek此次“透明化”披露,不仅展示了其技术实力与商业潜力,更向行业传递明确信号:AI大模型的盈利闭环已从理想照进现实,标志着AI技术从实验室迈向产业化的关键转折。

  中信证券认为,Deepseek在模型训练成本降低方面的最佳实践,料将刺激科技巨头采用更为经济的方式加速前沿模型的探索和研究,同时将使得大量AI应用得以解锁和落地。算法训练带来的规模报酬递增效应以及单位算力成本降低对应的杰文斯悖论等,均意味着中短期维度科技巨头继续在AI算力领域进行持续、规模投入仍将是高确定性事件。

  本周以来,DeepSeek开启“开源周”,给人工智能领域扔下数颗“重磅炸弹”。回顾DeepSeek这五天开源的内容,信息量很大,具体来看:

  周一,DeepSeek宣布开源FlashMLA。FlashMLA是DeepSeek用于Hopper GPU的高效MLA解码内核,并针对可变长度序列进行了优化,现已投入生产;

  周二,DeepSeek宣布开源DeepEP,即首个用于MoE模型训练和推理的开源EP通信库,提供高吞吐量和低延迟的all-to-all GPU内核;

  周三,DeepSeek宣布开源DeepGEMM。其同时支持密集布局和两种MoE布局,完全即时编译,可为V3/R1模型的训练和推理提供强大支持等;

  周四,DeepSeek宣布开源Optimized Parallelism Strategies。其主要针对大规模模型训练中的效率问题;

  周五,DeepSeek宣布开源Fire-Flyer文件系统(3FS),以及基于3FS的数据处理框架Smallpond。

  因此,有网友评论称:“《DeepSeek-V3/R1推理系统概览》技术文章是‘开源周彩蛋’,直接亮出了底牌!”

  至此,DeepSeek“开源周”的连载或许要告一段落了,但DeepSeek后续动作依然值得持续关注。

  来源:券商中国

  声明:数据宝所有资讯内容不构成投资建议,股市有风险,投资需谨慎。

  责编:林丽峰

本文来自作者[陈家大海]投稿,不代表酷展号立场,如若转载,请注明出处:https://iosku.vip/twkp/2025sop04-3864.html

(23)

文章推荐

  • 服装属于什么行业

    网上科普有关“服装属于什么行业”话题很是火热,小编也是针对服装属于什么行业寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。该商品属于制造业的轻工纺织业。服装行业是轻工纺织业的一个分支,主要涉及服装的设计、制作、销售等方面,轻工纺织业是生产纺织品的行业,包括纺织

    2025年01月23日
    796
  • 中国生物制药现涨超5% 自研创新药“罗伐昔替尼”IB/IIA期临床研究结果发表于《血液》

      中国生物制药(01177)早盘上涨5.67%,现报3.54港元,成交额2.34亿港元。  3月10日,中国生物制药发布公告,该集团自主研发的国家1类创新药“罗伐昔替尼(Rovadicitinib)”用于治疗慢性移植物抗宿主病(cGVHD)的Ib/IIa期临床研究结果已发表于国际血液学领域顶

    2025年03月11日
    24
  • 国泰君安期货:大A年内首次突破3400,牛随春天一同归来了?

      张驰宁投资咨询号:Z0020302  国泰君安期货市场分析师  截至早间收盘,大A走出一根实体大阳线,在连续接近一个月的压制中,今日终于再度雄起,盘中突破3400整数关口压力,喜迎万众期待的二次走强。  根据布林指标,大A在先前的回调中,K线连续在中轨附近显现出支撑,昨日收盘一根长下影

    2025年03月14日
    19
  • 31省新增本土79例31省新增本土71例

    大家好,今天小编关注到一个比较有意思的话题,就是关于31省新增本土79例的问题,于是小编就整理了1个相关介绍31省新增本土79例的解答,让我们一起看看吧。吉林单日新增11例本土确诊病例,这到底是怎么回事?会不会造成疫情第二次爆发?吉林单日新增11例本土确诊病例,这到底是怎么回事?会不会造成疫情第二次

    2025年03月28日
    20
  • 荥阳网站建设(荥阳市网站建设)

    荥阳市网站建设一直是政府和企业的重要事项,也是当前最受欢迎的信息技术应用。通过建立一个网站,可以将信息、新闻、图片、产品等公开呈现出来,从而实现舆论监督、信息共享、营销宣传以及全方位服务的目标。作为一个地方性的网站,荥阳市网站建设要遵循“信息化——本地化——多样化”的原则,即将各方面内容整合到一个平

    2025年03月29日
    16
  • 河北移动网上营业厅话费查询(河北携号转网咋办理具体操作细节来了)

    河北新闻网11月12日讯(田薇、宋娜)11月10日,河北省携号转网服务试运行。所谓携号转网,就是在不换号的前提下更换运营商。工信部推行携号转网服务,是规范国内三大运营商提供更好服务的有力举措,最终受益的,当然是消费者。那么,目前河北的携转工作进展如何?运营商都有哪些积极应对的举措?我省广大用户对携号

    2025年03月30日
    26
  • 移动初始密码(你家摄像头正在直播私生活家庭摄像头安装需谨慎→)

    随着智能家居走入千家万户在家里安装摄像头也成了很多家庭的选择它可以防范偷盗和意外便于取证也能实时关注家中老人小孩、宠物的情况问题是,这些为了安全而安装的摄像头,真的安全吗?近日一位民警通过社交平台向市民发出了警示:家中最好谨慎安装摄像头。家庭摄像头本为守护安全,但若使用不当,反而可能成为隐私泄露的“

    2025年04月04日
    15
  • 小米汽车回应湛江SU7事故:初步了解相关火情由于碰撞后电动二轮车锂电池严重挤压和变形起火

      小米汽车4月11日就湛江事故发布情况说明:2025年4月5日获悉,当日凌晨,一辆小米SU7标准版在湛江市徐闻县曲界镇376省道,在驾驶员(经查非车主本人)手动驾驶状态行驶过程中,与一辆电动二轮车发生碰撞。事故发生后,肇事司机弃车逃逸。据警方最新通报,肇事司机目前已被执行逮捕。关于事故中汽车为什么

    2025年04月11日
    14
  • 媒体:OpenAI和软银考虑Stargate人工智能项目在英国进行投资

      英国《金融时报》援引未具名知情人士的话报道称,英国是OpenAI和软银建设新的海外人工智能基础设施项目的首选之一。耗资5,000亿美元的数据中心项目Stargate最初将只设在美国,英国已被视为未来国际扩张的一部分,德国和法国也是“有吸引力的候选人”。据一位参与分配Stargate支出的未具名人

    2025年04月17日
    13
  • 被打20个月后死亡被打20个月后死亡赔偿多少

    大家好,今天小编关注到一个比较有意思的话题,就是关于被打20个月后死亡的问题,于是小编就整理了4个相关介绍被打20个月后死亡的解答,让我们一起看看吧。老人去世后,补发20个月的工资一般多长时间能?国家对于死亡的参保人,从来没有规定发放20个月工资的规定,参保人死亡,从死亡的次月起,停发养老金,也就是

    2025年04月25日
    12

发表回复

本站作者后才能评论

评论列表(4条)

  • 陈家大海
    陈家大海 2025年04月26日

    我是酷展号的签约作者“陈家大海”!

  • 陈家大海
    陈家大海 2025年04月26日

    希望本篇文章《周末,DeepSeek扔出“王炸”首次披露了成本利润率 影响多大?》能对你有所帮助!

  • 陈家大海
    陈家大海 2025年04月26日

    本站[酷展号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • 陈家大海
    陈家大海 2025年04月26日

    本文概览:  周六,国内AI大模型公司DeepSeek官方账号在知乎首次发布《DeepSeek-V3/R1推理系统概览》技术文章,不仅公开了其推理系统的核心优化方案,更是首次披露了成本利...

    联系我们

    邮件:酷展号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们