北京大学2025年DeepSeek原理和落地应用报告57页




DeepSeek原理与落地应用AI肖睿团队(孙萍、吴寒、周嵘、李娜、张惠军、刘誉)2025年03月01日厦门大学大数据百家讲坛• 北大青鸟人工智能研究院• 北大计算机学院元宇宙技术研究所• 北大教育学院学习科学实验室7 人工智能概念辨析DeepSeek R1大模型原理落地应用目 录CONTENTS人工智能概念辨析PART 01大模型相关术语l多模态Ø文本、图片、音频、视频lAI工具(国内)ØDeepSeek、 豆包、Kimi、腾讯元宝、智谱清言、通义千问、秘塔搜索、微信搜索...l通用模型Ø大语言模型(LLM,Large Language Model)Ø视觉模型(图片、视频)Ø音频模型Ø多模态模型Ø……l行业模型(垂直模型、垂类模型)Ø教育、医疗、金融等 大模型的前世今生•人工智能:让机器具备动物智能,人类智能,非人类智能(超人类智能)•运算推理:规则核心;自动化•知识工程:知识核心;知识库+推理机•机器学习:学习核心;数据智能(统计学习方法,数据建模)•常规机器学习方法:逻辑回归,决策森林,支持向量机,马尔科夫链,…..•人工神经网络:与人脑最大的共同点是名字,机制和架构并不一样•传统神经网络:霍普菲尔德网络,玻尔兹曼机,…..•深度神经网络:深度学习•传统网络架构:DBN,CNN,RNN,ResNet,Inception,……•Transformer架构:可以并行矩阵计算(GPU),核心是注意力机制(Attention)•编码器(BERT):多数embedding模型,Ernie早期版本,…….•混合网络:T5、GLM•解码器(GPT):大语言模型(LLM),也是传统的多模态模型的核心•生成式人工智能(GenAI):AIGC•DeepSeek、Qwen、GLM、Step、MiniMax、hunyuan、kimi、……•OpenAI GPT(ChatGPT)、Claude、Llama、Grok、……•Diffusion架构:主要用于视觉模型(比如Stable Diffusion、DALLE),现在也开始尝试用于语言模型•Diffusion+Transformer架构:例如Sora的DiT(加入Diffusion的视觉模型),部分新的多模态模型架构大模型的发展阶段生成模型ref:中文大模型基准测评2024年度报告(2025.01.08)推理模型生成模型与推理大模型
相关推荐
-
2025-05-13 19936
-
2025-05-15 19943
-
2025-05-13 19950
-
2025-05-15 17939
-
2025-05-13 19833
-
2025-05-14 19537
-
2025-05-14 18531
-
2025-05-15 18933
-
2025-06-05 465
-
2025-06-05 301
相关内容
-
甲子光年2025年DeepSeeK开启AI算法变革元年报告16页
分类:机构报告
时间:2025-05-13
标签:
格式:PDF
-
新战略咨询2024移动机器人AGV_AMR专用激光雷达产品发展蓝皮书31页
分类:机构报告
时间:2025-05-15
标签:
格式:PDF
-
鼎帷咨询2025年DeepSeek战略创新分析报告-围绕DeepSeek尖刀点加速打造AI产业刀锋链39页
分类:机构报告
时间:2025-05-13
标签:
格式:PDF
-
少年商学院2025年DeepSeek中小学生使用手册81页
分类:机构报告
时间:2025-05-13
标签:
格式:PDF
-
英普利集团2025企业出海白皮书中东篇精编版39页
分类:机构报告
时间:2025-05-14
标签:
格式:PDF
-
火山引擎2024火山引擎视频云实践精选集224页
分类:机构报告
时间:2025-05-15
标签:
格式:PDF
-
曼昆律所2024年Web3.0区块链项目出海法律白皮书71页
分类:机构报告
时间:2025-05-14
标签:
格式:PDF
-
CyberRobo2024全球人形机器人产品数据库报告-人形机器人洞察研究BTIResearch99页
分类:机构报告
时间:2025-05-15
标签:
格式:PDF
-
2025泡泡玛特POP MART品牌手册
分类:
时间:2025-06-21
标签:
格式:PDF
-
利用人工智能技术全面应对电子邮件威胁
分类:
时间:2025-06-21
标签:
格式:PDF