科智咨询2025年Deepseek对算力产业的影响报告27页

3.0 2025-05-13 81 0 1751 KB 27 页 VIP免费 PDF

侵权投诉

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

0 人已下载

立即下载

摘要：

CONFIDENTIALDeepseek对中国算力产业的影响2025年2月-2-1DeepSeek的技术突破与市场定位目录CONTENT2DeepSeek驱动算力需求变革3算力产业链的重构-3-DeepSeek爆火--C端：Deepseek全球破圈，成为用户规模增长最快的移动AI应用超级app增长1亿用户所用时间App上线后同样天数DeepSeek与ChatGPT移动端全球DAU对比情况-4-DeepSeek爆火--B端：科技巨头积极拥抱DeepSeek-5-DeepSeek明星产品：DeepSeek的LLM模型分为三个版本：基座模型V3、强化推理版R1-Zero、泛化推理版R1-6-DeepSeek爆火的原因：一流的性能表现、大幅降低的算力成本、开源模式DeepSeek的模型架构创新，如MoE和FP8混合精度训练，大幅提升模型性能和训练效率。高性能模型架构创新通过算法创新和硬件优化，DeepSeek以低成本实现高性能，改变AI领域的竞争规则。低成本实现高性能DeepSeek采用开源策略，降低AI技术门槛，促进全球开发者参与，推动技术快速普及和迭代。开源策略推动技术普及-7-一流的性能表现：DeepSeek-V3性能对齐海外领军闭源模型-8-一流的性能表现：DeepSeek-R1性能对标OpenAI-o1正式版•DeepSeek-R1性能比肩OpenAI-o1。DeepSeek-R1在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩OpenAI o1正式版。•R1 在 2024 年 AIME 测试中取得了 79.8% 的成绩，与 OpenAI o1 的 79.2% 水平相当。在 MATH-500 基准测试中，DeepSeek-R1 以 97.3% 的成绩略微超越了 o1 的 96.4%。在编程领域，该模型在 Codeforces平台上表现优异。-9-大幅降低的算力成本：训练算力下降90%DeepSeek-V3和R1模型不仅性能出色，训练成本也极低。V3模型仅用2048块H800 GPU训练2个月，消耗278.8万GPU小时。相比之下，Llama3-405B消耗了3080万GPU小时，是V3的11倍。按H800 GPU每小时2美金计算，V3的训练成本仅为557.6万美金，而同等性能的模

展开>> 收起<<

科智咨询2025年Deepseek对算力产业的影响报告27页

共 27 页,预览5页

还剩22页未读，继续阅读