SambaNovaSN40LRDU突破万亿参数规模GenAI计算的壁垒






SambaNova SN40L RDU: Breaking the Barrier of Trillion+ Parameter Scale Gen AI ComputingRaghu PrabhakarArchitect, SambaNovaSystemsHotChips2024Copyright © 2024 SambaNova Systems Inc.SN40L:SambaNova’sNew Language-Optimized RDU2“Cerulean” Architecture-based Reconfigurable Dataflow Unit1.5 TB High Capacity Memory5nm TSMC3-tier Dataflow Memory1,040 RDU Cores102B Transistors64 GB High Bandwidth Memory520 MB On-Chip Memory638 TFLOPS (bf16)Cerulean SN40L RDUGenerative AI Training and InferenceCopyright © 2024 SambaNova Systems Inc.On-Chip SRAM[8 GB, PBs per sec]RDU High Bandwidth Memory [1 TB] RDU High Capacity DDR Memory [24 TB]1600 GB/s25.6 TB/sHigh throughput inference with caching Low Latency Model Switching(E.g., < 0.01s for llama3.1 8B)Dataflow enabled by large On-Chip Memory3SN40L:SambaNova’sNew Language-Optimized RDU3-tier Memory System with SRAM, HBM, and DDRCopyright © 2024 SambaNova Systems Inc.SN40L Chip: Tile Architecture 1040PCUs and PMUsPCU: Compute unitPMU: Memory unitS: Mesh sw
相关推荐
相关内容
-
腾讯云中国信通院中国通信标准化协会2024年AI大模型应用发展研究报告58页
分类:
时间:2025-05-09
标签:
格式:PDF
-
利用智能视觉组件简化嵌入式视觉开发
分类:
时间:2025-05-09
标签:
格式:PDF
-
俄勒冈州交通规划在快速变化和不确定的时代利用情景规划的案例研究
分类:
时间:2025-05-09
标签:
格式:PDF
-
SiCMOSFET技术进展与发展方向
分类:
时间:2025-05-09
标签:
格式:PDF
-
康嘉种业-每一头猪都代表着康嘉人的尊严
分类:
时间:2025-05-09
标签:
格式:PDF
-
汽车行业周报小米SU7Ultra正式发布Helix带动Figure效率跃升-25030118页
分类:
时间:2025-05-09
标签:
格式:PDF
-
杨昕-AI驱动抖音用户体验中台探索与实践
分类:
时间:2025-05-10
标签:
格式:PDF
-
跨国的AI采用者的肖像公司特征资产的互补性和生产力
分类:
时间:2025-05-10
标签:
格式:PDF
-
OrChechikandDanielFrank-从侦察到毁灭揭露伊朗AgriusAPT最新TTPs
分类:
时间:2025-05-10
标签:
格式:PDF
-
爱立信混合工作模式调查结果
分类:
时间:2025-05-10
标签:
格式:PDF