杨敏-数据驱动下的大模型微调策略与挑战

3.0 2025-05-12 25 0 9545 KB 74 页 PDF
侵权投诉
杨敏-数据驱动下的大模型微调策略与挑战
杨敏-数据驱动下的大模型微调策略与挑战
杨敏-数据驱动下的大模型微调策略与挑战
摘要:

数据驱动下的大模型微调:策略与挑战杨敏 & 倪仕文YSSNLP 2024 — 昆明YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024团队介绍SIAT-NLP另有博士生研究生和硕士生研究生30余人谭明环 博士新加坡管理大学助理研究员倪仕文 博士台湾成功大学助理研究员杨敏 博士中科院深圳先进院数据挖掘实验室主任中科院青促会成员连续三年入选全球前2%顶尖科学家 YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024大语言模型指令微调介绍指令微调数据集及其构造高质量指令微调数据筛选各种指令微调方法及解析01020304目录YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024大语言模型指令微调介绍指令微调数据集及其构造高质量指令微调数据筛选各种指令微调方法及解析01020304YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024 大语言模型什么是大模型指令微调?预训练是大模型训练的第一阶段,模型在大量无标签语料库上进行训练,使其能够充分理解语言的基本语法、语义和上下文关系,学习海量基础知识。 预训练大量无标签数据YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024什么是大模型指令微调?任务/领域 1任务/领域 2任务/领域 3任务/领域 4任务/领域 5 大语言模型指令微调没见过的任务/领域任务/领域 1任务/领域 2任务/领域 3微调是预训练之后大模型训练的第二阶段,预训练阶段模型学习到海量知识,但是模型还没有学会解决各类具体的任务。通过多任务指令微调,让模型学会使用预训练阶段习得的知识,使之具备正确响应各种输入的能力。YSSNLP2024YS

展开>> 收起<<
杨敏-数据驱动下的大模型微调策略与挑战

共 74 页,预览3页

还剩71页未读, 继续阅读

杨敏-数据驱动下的大模型微调策略与挑战
杨敏-数据驱动下的大模型微调策略与挑战
杨敏-数据驱动下的大模型微调策略与挑战
声明:企商查报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
作者: 分类:机构报告 属性:74 页 大小:9545 KB 格式:PDF 时间:2025-05-12

开通VIP享超值会员特权

  • 多端同步记录
  • 高速下载文档
  • 免费文档工具
  • 分享文档赚钱
  • 每日登录抽奖
  • 优质衍生服务
/ 3
客服
关注