北京大学2025年DeepSeek原理和落地应用报告57页

3.0 2025-05-13 33 0 9775 KB 57 页 VIP免费 PDF

侵权投诉

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

0 人已下载

立即下载

摘要：

DeepSeek原理与落地应用AI肖睿团队（孙萍、吴寒、周嵘、李娜、张惠军、刘誉）2025年03月01日厦门大学大数据百家讲坛• 北大青鸟人工智能研究院• 北大计算机学院元宇宙技术研究所• 北大教育学院学习科学实验室7 人工智能概念辨析DeepSeek R1大模型原理落地应用目录CONTENTS人工智能概念辨析PART 01大模型相关术语l多模态Ø文本、图片、音频、视频lAI工具（国内）ØDeepSeek、豆包、Kimi、腾讯元宝、智谱清言、通义千问、秘塔搜索、微信搜索...l通用模型Ø大语言模型（LLM，Large Language Model）Ø视觉模型（图片、视频）Ø音频模型Ø多模态模型Ø……l行业模型（垂直模型、垂类模型）Ø教育、医疗、金融等大模型的前世今生•人工智能：让机器具备动物智能，人类智能，非人类智能（超人类智能）•运算推理：规则核心；自动化•知识工程：知识核心；知识库+推理机•机器学习：学习核心；数据智能（统计学习方法，数据建模）•常规机器学习方法：逻辑回归，决策森林，支持向量机，马尔科夫链，…..•人工神经网络：与人脑最大的共同点是名字，机制和架构并不一样•传统神经网络：霍普菲尔德网络，玻尔兹曼机，…..•深度神经网络：深度学习•传统网络架构：DBN，CNN，RNN，ResNet，Inception，……•Transformer架构：可以并行矩阵计算（GPU），核心是注意力机制（Attention）•编码器（BERT）：多数embedding模型，Ernie早期版本，…….•混合网络：T5、GLM•解码器（GPT）：大语言模型（LLM），也是传统的多模态模型的核心•生成式人工智能（GenAI）：AIGC•DeepSeek、Qwen、GLM、Step、MiniMax、hunyuan、kimi、……•OpenAI GPT（ChatGPT）、Claude、Llama、Grok、……•Diffusion架构：主要用于视觉模型（比如Stable Diffusion、DALLE），现在也开始尝试用于语言模型•Diffusion+Transformer架构：例如Sora的DiT（加入Diffusion的视觉模型），部分新的多模态模型架构大模型的发展阶段生成模型ref:中文大模型基准测评2024年度报告(2025.01.08)推理模型生成模型与推理大模型

展开>> 收起<<

北京大学2025年DeepSeek原理和落地应用报告57页

共 57 页,预览5页

还剩52页未读，继续阅读