刘勇-检索增强RAG能提升大模型的推理能力吗




检索增强(RAG)能提升大模型的推理能力吗?中国人民大学高瓴人工智能学院刘 勇2目录丨CATALOGUE背景介绍基本设定理想情况有噪音情况01020304What is RAG•LLMs存在问题–幻觉问题:有论文证实,自回归预训练的大语言模型的幻觉问题不可避免[1],LLM无可避免的会提供部分虚假信息–时效性问题:规模越大,大模型训练的成本越高,更新知识的代价越大,对于一些高时效性的任务,大模型无能为力–数据安全:OpenAI已经遭到过几次隐私数据的投诉,企业不会把自己的经营数据、合同文件等机密文件和数据上传到互联网上的大模型•RAG(Retrieval-AugmentedGeneration,检索增强)–是解决上述问题的当前比较流行的方法[2]3[1] Calibrated Language Models Must Hallucinate Adam. In STOC[2] Retrieval-augmented generation for large language models: A surveyWhat is RAG第五步:生成答案第一步:用户提出问题第二步:检索文档第三步:选出相关文档第四步:Query+文档输入大模型•LLM: 𝑝(𝑦|𝑞)–其中,𝑞为query, 𝑦为答案5Can RAG Help Reasoning?•RAG: 𝑝𝑦𝑞,𝑑1,𝑑2,⋯–其中,𝑞为query, 𝑑𝑖为document, 𝑦为答案–RAG提供额外的信息Question:RAG能提升推理能力吗?•Chain of Thought (CoT) –理论上已经证明COT能提升LLM的推理能力[3]6相当于增加的Transformer的深度Chain of Thought (COT)•能增加推理的原因COT:𝑝𝑦𝑞,𝑥1,𝑥2,…–𝑥𝑖为推理的中间结果–𝑥1=𝑝𝑦|𝑞,𝑥2=𝑝𝑦|𝑥,𝑥1,⋯,𝑦=𝑝𝑦𝑥,𝑥1,⋯,𝑥𝑘[3] Chain-of-thought prompting elicits reasoning in large language models. In NeurIPS20227COT:推理理论上可以重复很多次RAG:一般只执行一次COT: 𝑝𝑦𝑞,𝑥1,𝑥2,…RAG: 𝑝�
相关推荐
-
2025-05-13 19936
-
2025-05-15 19943
-
2025-05-13 19950
-
2025-05-15 17939
-
2025-05-13 19833
-
2025-05-14 19537
-
2025-05-14 18531
-
2025-05-15 18933
-
2025-06-05 465
-
2025-06-05 301
相关内容
-
甲子光年2025年DeepSeeK开启AI算法变革元年报告16页
分类:机构报告
时间:2025-05-13
标签:
格式:PDF
-
新战略咨询2024移动机器人AGV_AMR专用激光雷达产品发展蓝皮书31页
分类:机构报告
时间:2025-05-15
标签:
格式:PDF
-
鼎帷咨询2025年DeepSeek战略创新分析报告-围绕DeepSeek尖刀点加速打造AI产业刀锋链39页
分类:机构报告
时间:2025-05-13
标签:
格式:PDF
-
少年商学院2025年DeepSeek中小学生使用手册81页
分类:机构报告
时间:2025-05-13
标签:
格式:PDF
-
英普利集团2025企业出海白皮书中东篇精编版39页
分类:机构报告
时间:2025-05-14
标签:
格式:PDF
-
火山引擎2024火山引擎视频云实践精选集224页
分类:机构报告
时间:2025-05-15
标签:
格式:PDF
-
曼昆律所2024年Web3.0区块链项目出海法律白皮书71页
分类:机构报告
时间:2025-05-14
标签:
格式:PDF
-
CyberRobo2024全球人形机器人产品数据库报告-人形机器人洞察研究BTIResearch99页
分类:机构报告
时间:2025-05-15
标签:
格式:PDF
-
2025泡泡玛特POP MART品牌手册
分类:
时间:2025-06-21
标签:
格式:PDF
-
利用人工智能技术全面应对电子邮件威胁
分类:
时间:2025-06-21
标签:
格式:PDF