杨敏-数据驱动下的大模型微调策略与挑战




数据驱动下的大模型微调:策略与挑战杨敏 & 倪仕文YSSNLP 2024 — 昆明YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024团队介绍SIAT-NLP另有博士生研究生和硕士生研究生30余人谭明环 博士新加坡管理大学助理研究员倪仕文 博士台湾成功大学助理研究员杨敏 博士中科院深圳先进院数据挖掘实验室主任中科院青促会成员连续三年入选全球前2%顶尖科学家 YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024大语言模型指令微调介绍指令微调数据集及其构造高质量指令微调数据筛选各种指令微调方法及解析01020304目录YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024大语言模型指令微调介绍指令微调数据集及其构造高质量指令微调数据筛选各种指令微调方法及解析01020304YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024 大语言模型什么是大模型指令微调?预训练是大模型训练的第一阶段,模型在大量无标签语料库上进行训练,使其能够充分理解语言的基本语法、语义和上下文关系,学习海量基础知识。 预训练大量无标签数据YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024什么是大模型指令微调?任务/领域 1任务/领域 2任务/领域 3任务/领域 4任务/领域 5 大语言模型指令微调没见过的任务/领域任务/领域 1任务/领域 2任务/领域 3微调是预训练之后大模型训练的第二阶段,预训练阶段模型学习到海量知识,但是模型还没有学会解决各类具体的任务。通过多任务指令微调,让模型学会使用预训练阶段习得的知识,使之具备正确响应各种输入的能力。YSSNLP2024YS
相关推荐
-
2025-05-13 19936
-
2025-05-15 19943
-
2025-05-13 19950
-
2025-05-15 17939
-
2025-05-13 19833
-
2025-05-14 19537
-
2025-05-14 18531
-
2025-05-15 18933
-
2025-06-05 465
-
2025-06-05 301
相关内容
-
甲子光年2025年DeepSeeK开启AI算法变革元年报告16页
分类:机构报告
时间:2025-05-13
标签:
格式:PDF
-
新战略咨询2024移动机器人AGV_AMR专用激光雷达产品发展蓝皮书31页
分类:机构报告
时间:2025-05-15
标签:
格式:PDF
-
鼎帷咨询2025年DeepSeek战略创新分析报告-围绕DeepSeek尖刀点加速打造AI产业刀锋链39页
分类:机构报告
时间:2025-05-13
标签:
格式:PDF
-
少年商学院2025年DeepSeek中小学生使用手册81页
分类:机构报告
时间:2025-05-13
标签:
格式:PDF
-
英普利集团2025企业出海白皮书中东篇精编版39页
分类:机构报告
时间:2025-05-14
标签:
格式:PDF
-
火山引擎2024火山引擎视频云实践精选集224页
分类:机构报告
时间:2025-05-15
标签:
格式:PDF
-
曼昆律所2024年Web3.0区块链项目出海法律白皮书71页
分类:机构报告
时间:2025-05-14
标签:
格式:PDF
-
CyberRobo2024全球人形机器人产品数据库报告-人形机器人洞察研究BTIResearch99页
分类:机构报告
时间:2025-05-15
标签:
格式:PDF
-
2025泡泡玛特POP MART品牌手册
分类:
时间:2025-06-21
标签:
格式:PDF
-
利用人工智能技术全面应对电子邮件威胁
分类:
时间:2025-06-21
标签:
格式:PDF