科智咨询2025年Deepseek对算力产业的影响报告27页

3.0 2025-05-13 78 0 1751 KB 27 页 PDF
侵权投诉
科智咨询2025年Deepseek对算力产业的影响报告27页
科智咨询2025年Deepseek对算力产业的影响报告27页
科智咨询2025年Deepseek对算力产业的影响报告27页
科智咨询2025年Deepseek对算力产业的影响报告27页
科智咨询2025年Deepseek对算力产业的影响报告27页
摘要:

CONFIDENTIALDeepseek对中国算力产业的影响2025年2月-2-1DeepSeek的技术突破与市场定位目录CONTENT2DeepSeek驱动算力需求变革3算力产业链的重构-3-DeepSeek爆火--C端:Deepseek全球破圈,成为用户规模增长最快的移动AI应用超级app增长1亿用户所用时间App上线后同样天数DeepSeek与ChatGPT移动端全球DAU对比情况-4-DeepSeek爆火--B端:科技巨头积极拥抱DeepSeek-5-DeepSeek明星产品:DeepSeek的LLM模型分为三个版本:基座模型V3、强化推理版R1-Zero、泛化推理版R1-6-DeepSeek爆火的原因:一流的性能表现、大幅降低的算力成本、开源模式DeepSeek的模型架构创新,如MoE和FP8混合精度训练,大幅提升模型性能和训练效率。高性能模型架构创新通过算法创新和硬件优化,DeepSeek以低成本实现高性能,改变AI领域的竞争规则。低成本实现高性能DeepSeek采用开源策略,降低AI技术门槛,促进全球开发者参与,推动技术快速普及和迭代。开源策略推动技术普及-7-一流的性能表现:DeepSeek-V3性能对齐海外领军闭源模型-8-一流的性能表现:DeepSeek-R1性能对标OpenAI-o1正式版•DeepSeek-R1性能比肩OpenAI-o1。DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。•R1 在 2024 年 AIME 测试中取得了 79.8% 的成绩,与 OpenAI o1 的 79.2% 水平相当。在 MATH-500 基准测试中,DeepSeek-R1 以 97.3% 的成绩略微超越了 o1 的 96.4%。在编程领域,该模型在 Codeforces平台上表现优异。-9-大幅降低的算力成本:训练算力下降90%DeepSeek-V3和R1模型不仅性能出色,训练成本也极低。V3模型仅用2048块H800 GPU训练2个月,消耗278.8万GPU小时。相比之下,Llama3-405B消耗了3080万GPU小时,是V3的11倍。按H800 GPU每小时2美金计算,V3的训练成本仅为557.6万美金,而同等性能的模

展开>> 收起<<
科智咨询2025年Deepseek对算力产业的影响报告27页

共 27 页,预览3页

还剩24页未读, 继续阅读

声明:企商查报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
作者: 分类: 属性:27 页 大小:1751 KB 格式:PDF 时间:2025-05-13

开通VIP享超值会员特权

  • 多端同步记录
  • 高速下载文档
  • 免费文档工具
  • 分享文档赚钱
  • 每日登录抽奖
  • 优质衍生服务
/ 3
客服
关注