大模型工具学习-林衍凯




报告人:林衍凯单 位:中国人民大学 高瓴人工智能学院大模型工具学习YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024大模型带来智能涌现•学习大数据需要大参数,训练大参数模型需要大算力,计算量增长使模型涌现智能大模型随计算量增长而不断生出新能力大模型随计算量增长而产生能力阶跃2YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024大模型智能体:迈向通⽤的⼈⼯智能•美国《发现》杂志:过去十万年里脑容量不再增长,人类通过使用工具和分工协作达成能力延展,实现了人类文明的进一步阶跃式发展YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024使⽤⼯具是⼈类智能的关键特性之一•人类能力——工具使用 v.s. 人工智能——工具智能•工具改善人类生活条件,提高生产效率,推动科技和文明的进步•问题:人工智能是否具备与人类同样创造工具和使用工具的能力?YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024⼯具学习—前沿研究⽅向•OpenAI、Google等陆续发布WebGPT、ToolFormer等项目,证明大模型能够模仿人类使用搜索引擎、计算器等外部工具,达到了接近乃至超越人类用户的工具使用性能YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024⼯具学习——实现方法•示范学习:通过记录人类使用工具行为数据,大模型模仿人类行为习得工具学习能力•教程学习:通过让模型阅读工具使用手册(教程),理解工具功能及其调用方式•探索学习:模型能够通过自主探索,基于强化学习,根据环境反馈纠正错误1. 示范学习2. 教程学习3. 探索学习人类监督逐渐减少,模型自主化程度逐渐提高(用户点击序列:下翻页面、点击、键入等)(API手册、工具文档等)(API调用成功率,用户反馈等)YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024示范学习——WebGPT•模拟人类使用搜索引擎的行:点击、滚动、……•
相关推荐
-
2025-05-13 19936
-
2025-05-15 19943
-
2025-05-13 19950
-
2025-05-15 17939
-
2025-05-13 19833
-
2025-05-14 19537
-
2025-05-14 18531
-
2025-05-15 18933
-
2025-06-05 465
-
2025-06-05 301
相关内容
-
甲子光年2025年DeepSeeK开启AI算法变革元年报告16页
分类:机构报告
时间:2025-05-13
标签:
格式:PDF
-
新战略咨询2024移动机器人AGV_AMR专用激光雷达产品发展蓝皮书31页
分类:机构报告
时间:2025-05-15
标签:
格式:PDF
-
鼎帷咨询2025年DeepSeek战略创新分析报告-围绕DeepSeek尖刀点加速打造AI产业刀锋链39页
分类:机构报告
时间:2025-05-13
标签:
格式:PDF
-
少年商学院2025年DeepSeek中小学生使用手册81页
分类:机构报告
时间:2025-05-13
标签:
格式:PDF
-
英普利集团2025企业出海白皮书中东篇精编版39页
分类:机构报告
时间:2025-05-14
标签:
格式:PDF
-
火山引擎2024火山引擎视频云实践精选集224页
分类:机构报告
时间:2025-05-15
标签:
格式:PDF
-
曼昆律所2024年Web3.0区块链项目出海法律白皮书71页
分类:机构报告
时间:2025-05-14
标签:
格式:PDF
-
CyberRobo2024全球人形机器人产品数据库报告-人形机器人洞察研究BTIResearch99页
分类:机构报告
时间:2025-05-15
标签:
格式:PDF
-
2025泡泡玛特POP MART品牌手册
分类:
时间:2025-06-21
标签:
格式:PDF
-
利用人工智能技术全面应对电子邮件威胁
分类:
时间:2025-06-21
标签:
格式:PDF