阿里云释放算力潜能加速应用构建Serverless为AI创新提速2023-1页






释放算力潜能加速应用构建Serverless为AI 创新提速赵庆杰阿里云Serverless基础架构团队负责人2023年12月1日目录01AI应用的发展趋势以及面临挑战02Serverless技术加速AI应用的构建03ServerlessAI应用案例AI 应用场景极速增长百花齐鸣的AI应用市场竞争下,“迭代速度”成为关键因素之一异构计算GPUCPUNPUFPGA资源调度资源虚拟化分布式调度基础设施:数据存储与高性能网络模型训练AI计算开发者领域AI工具算法框架AIStudio算法库AI在线应用(推理)AI应用PaaS平台网关鉴权快速部署服务依赖AI应用面临的挑战•AI应用的构建复杂,且需要多环境部署支持,需要与非AI应用集成•随着AI应用功能逐渐丰富,调用链路长极大影响问题的快速发现•AI应用组件无法复用,持续重复造轮子,浪费资源成本,如绿网能力,队列等•网关通用能力,安全鉴权,限流保护,多协议支持,防护攻击等AI计算力面临的挑战•GPU资源紧缺且成本高,需要持续保有购买•卡型不统一导致算力不统一,进而影响应用层架构•随着计算规模的提升,容错能力也越来越重要•大数据的读取,以及模型的快速加载,对于底层的技术要求越来越高AI 技术概览GPU太贵,型号那么多,换代快,怎么架集群找不到GPU机器用机器利用率太低了!那么多机器都闲着听说GPU很快,但是我们工程师用起来反而比CPU慢硬件复杂度资源管理复杂度全系统优化复杂度调度效率复杂度经常听到的问题?Serverless AI 应用解决方案如何高效率低成本落地如何方便快捷部署使用工程相关算法相关接口相关•工程能力比较强,更希望有一个平台可以提升整体的研发效能,降低运维成本;•往往和实验室/公司内的设备有强关联,需要有安全保障等;负责AI应用平台建设和管理负责AI模型开发调试通过API等对接口进行工程化封装•算法能力比较强,希望有一个好用的AI模型管理平台;•希望可以在本进行开发调试、线上进行测试的时候,有一个便捷的环境等;•工程能力比较强,更希望有一些项目案例等,可以帮助业务快速的发布和上线;•有完整的应用开发、调试、发布流程等;AI开发者模型相关工程相关算法相关接口相关不同角色,在AI 场景下的诉求函数计算提供构建现代化高可用AI 应用的简化路径,是AI 应用的最佳实践Serverless 开发平台AI 场景•三步上手最佳
相关推荐
-
2025-05-13 19930
-
2025-05-15 19937
-
2025-05-13 19935
-
2025-05-15 17935
-
2025-05-13 19830
-
2025-05-14 19531
-
2025-05-14 18530
-
2025-05-15 18930
-
2025-05-09 81
-
2025-05-09 76
相关内容
-
新战略咨询2024移动机器人AGV_AMR专用激光雷达产品发展蓝皮书31页
分类:
时间:2025-05-15
标签:
格式:PDF
-
甲子光年2025年DeepSeeK开启AI算法变革元年报告16页
分类:
时间:2025-05-13
标签:
格式:PDF
-
鼎帷咨询2025年DeepSeek战略创新分析报告-围绕DeepSeek尖刀点加速打造AI产业刀锋链39页
分类:
时间:2025-05-13
标签:
格式:PDF
-
少年商学院2025年DeepSeek中小学生使用手册81页
分类:
时间:2025-05-13
标签:
格式:PDF
-
英普利集团2025企业出海白皮书中东篇精编版39页
分类:
时间:2025-05-14
标签:
格式:PDF
-
火山引擎2024火山引擎视频云实践精选集224页
分类:
时间:2025-05-15
标签:
格式:PDF
-
曼昆律所2024年Web3.0区块链项目出海法律白皮书71页
分类:
时间:2025-05-14
标签:
格式:PDF
-
CyberRobo2024全球人形机器人产品数据库报告-人形机器人洞察研究BTIResearch99页
分类:
时间:2025-05-15
标签:
格式:PDF
-
腾讯云中国信通院中国通信标准化协会2024年AI大模型应用发展研究报告58页
分类:
时间:2025-05-09
标签:
格式:PDF
-
利用智能视觉组件简化嵌入式视觉开发
分类:
时间:2025-05-09
标签:
格式:PDF