DOJO使用以太网传输协议TTPoE的Exa级有损人工智能网络

3.0 2025-05-12 92 0 6904 KB 23 页 PDF
侵权投诉
DOJO使用以太网传输协议TTPoE的Exa级有损人工智能网络
DOJO使用以太网传输协议TTPoE的Exa级有损人工智能网络
DOJO使用以太网传输协议TTPoE的Exa级有损人工智能网络
DOJO使用以太网传输协议TTPoE的Exa级有损人工智能网络
DOJO使用以太网传输协议TTPoE的Exa级有损人工智能网络
摘要:

HOT CHIPS 2024Tesla Transport Protocol over Ethernet (TTPoE)A new lossy, Exa-Scale fabric for the Dojo AI SupercomputerEric Quinnell, Ph.D.Dojo Fabric Lead2HOT CHIPS 2024Problem StatementTCP/IP is too slow for scaled AI interconnect•Bound by CPU SW kernelLossless fabrics are complex and brittle•Priority Flow Control (PFC) affects the global networkIdeal Fabric:•Lowest latency •Highest bandwidth•Simple SoftwareFor Tesla AI:•Layer 2 only•Collective communications and ingest•Low congestion, single application3HOT CHIPS 2024TTPoETesla Transport Protocol over Ethernet (TTPoE)is a peer-to-peer ethernet Transport Layer Protocol executed entirely in hardware.Why a custom transport protocol? 1.Vertical Integration – extend Dojo RDMA onto optical fabric2.“Lossy” ethernet network – ease of scaling, cost, congestion mgmt.3.Use 3rd party hardware – Ethernet II frames “Just Work” TCP got it right – just do it in hardware4HOT CHIPS 2024Dojo OSI LayersOSI LayerExample Protocols (TCP/IP)TCP/IP Implem

展开>> 收起<<
DOJO使用以太网传输协议TTPoE的Exa级有损人工智能网络

共 23 页,预览3页

还剩20页未读, 继续阅读

声明:企商查报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
作者: 分类: 属性:23 页 大小:6904 KB 格式:PDF 时间:2025-05-12

开通VIP享超值会员特权

  • 多端同步记录
  • 高速下载文档
  • 免费文档工具
  • 分享文档赚钱
  • 每日登录抽奖
  • 优质衍生服务
/ 3
客服
关注