北京大学2025年DeepSeek原理和落地应用报告57页

3.0 2025-05-13 30 0 9775 KB 57 页 PDF
侵权投诉
北京大学2025年DeepSeek原理和落地应用报告57页
北京大学2025年DeepSeek原理和落地应用报告57页
北京大学2025年DeepSeek原理和落地应用报告57页
摘要:

DeepSeek原理与落地应用AI肖睿团队(孙萍、吴寒、周嵘、李娜、张惠军、刘誉)2025年03月01日厦门大学大数据百家讲坛• 北大青鸟人工智能研究院• 北大计算机学院元宇宙技术研究所• 北大教育学院学习科学实验室7 人工智能概念辨析DeepSeek R1大模型原理落地应用目 录CONTENTS人工智能概念辨析PART 01大模型相关术语l多模态Ø文本、图片、音频、视频lAI工具(国内)ØDeepSeek、 豆包、Kimi、腾讯元宝、智谱清言、通义千问、秘塔搜索、微信搜索...l通用模型Ø大语言模型(LLM,Large Language Model)Ø视觉模型(图片、视频)Ø音频模型Ø多模态模型Ø……l行业模型(垂直模型、垂类模型)Ø教育、医疗、金融等 大模型的前世今生•人工智能:让机器具备动物智能,人类智能,非人类智能(超人类智能)•运算推理:规则核心;自动化•知识工程:知识核心;知识库+推理机•机器学习:学习核心;数据智能(统计学习方法,数据建模)•常规机器学习方法:逻辑回归,决策森林,支持向量机,马尔科夫链,…..•人工神经网络:与人脑最大的共同点是名字,机制和架构并不一样•传统神经网络:霍普菲尔德网络,玻尔兹曼机,…..•深度神经网络:深度学习•传统网络架构:DBN,CNN,RNN,ResNet,Inception,……•Transformer架构:可以并行矩阵计算(GPU),核心是注意力机制(Attention)•编码器(BERT):多数embedding模型,Ernie早期版本,…….•混合网络:T5、GLM•解码器(GPT):大语言模型(LLM),也是传统的多模态模型的核心•生成式人工智能(GenAI):AIGC•DeepSeek、Qwen、GLM、Step、MiniMax、hunyuan、kimi、……•OpenAI GPT(ChatGPT)、Claude、Llama、Grok、……•Diffusion架构:主要用于视觉模型(比如Stable Diffusion、DALLE),现在也开始尝试用于语言模型•Diffusion+Transformer架构:例如Sora的DiT(加入Diffusion的视觉模型),部分新的多模态模型架构大模型的发展阶段生成模型ref:中文大模型基准测评2024年度报告(2025.01.08)推理模型生成模型与推理大模型

展开>> 收起<<
北京大学2025年DeepSeek原理和落地应用报告57页

共 57 页,预览3页

还剩54页未读, 继续阅读

北京大学2025年DeepSeek原理和落地应用报告57页
北京大学2025年DeepSeek原理和落地应用报告57页
北京大学2025年DeepSeek原理和落地应用报告57页
声明:企商查报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
作者: 分类:机构报告 属性:57 页 大小:9775 KB 格式:PDF 时间:2025-05-13

开通VIP享超值会员特权

  • 多端同步记录
  • 高速下载文档
  • 免费文档工具
  • 分享文档赚钱
  • 每日登录抽奖
  • 优质衍生服务
/ 3
客服
关注