尹一峰-RAG基本范式的选择与系统设计






RAG 基本范式的选择与系统设计演讲⼈:尹⼀峰Hugging Face, Machine Learning Engineer0102030405⽬录RAG 简介Semantic Search 到底是在做什么?系统设计KG RAG未来的趋势与挑战RAG 简介01我们为什么需要RAG?为什么需要RAG?LLM的两个问题:•再训练成本⾼•世界在改变,现实世界的数据分布在改变(Distribution shift / Concept Drift etc)•以反向传播训练的⼤模型⽆法做到牵⼀发⽽不动全身•每次训练成本都很⾼(需要混⼊之前的数据,测试等等)•对于通⽤模型⽽⾔,训练结束⽴⻢过时•幻觉•LLM是⾃回归概率模型•⽆法彻底根除幻觉,但可以缓解症状为什么需要RAG?问题如何解决?•主流 LLM 是以 transformer 架构驱动的⾃回归模型(事情正在起变化,后⾯细说)•条件概率模型•理论上说,通过调整 prompt,我们可以让 LLM 输出任何 token 组合•LLM 的两个问题都可以通过调整 prompt 来缓解•RAG 的本质就是通过调整⾃回归条件来优化输出•Prompt EngineeringPθ(x)=n∏i=1pθ(xi|prompt,x<i)为什么需要RAG?RAG:•通过检索的⽅式选择 Prompt Engineering 的材料•任何形式的搜索都可以•SQL,搜索引擎,Vector Database, Elastic Search etc•只要能把合适的⽂件找到就可以•通过改变条件影响输出分布•新知识 — 对抗 Distribution Shift•相关⽂件 — 减少幻觉Semantic Search 到底在做什么?02Semantic Search•起源⾃Metric Embedding•将⽂件投射到⼀个⾼维度测度空间 (Metric Space)•Metric Distance Function: 与⾃⼰距离为 0,两个不同的点距离⼤于 0,距离对称,三⻆不等式•投射函数让⽮量间的距离有意义•Semantic Search•将⽂件投射到⼀个⾼维度空间(不⼀定是测度空间)•⾮测度距离亦可使⽤(Cosine Distance etc)•投射函数(Embedding Model)让⽮量间的距离有意义Semantic Search 到底是在做什么数据库检
相关推荐
相关内容
-
腾讯云中国信通院中国通信标准化协会2024年AI大模型应用发展研究报告58页
分类:
时间:2025-05-09
标签:
格式:PDF
-
利用智能视觉组件简化嵌入式视觉开发
分类:
时间:2025-05-09
标签:
格式:PDF
-
俄勒冈州交通规划在快速变化和不确定的时代利用情景规划的案例研究
分类:
时间:2025-05-09
标签:
格式:PDF
-
SiCMOSFET技术进展与发展方向
分类:
时间:2025-05-09
标签:
格式:PDF
-
康嘉种业-每一头猪都代表着康嘉人的尊严
分类:
时间:2025-05-09
标签:
格式:PDF
-
汽车行业周报小米SU7Ultra正式发布Helix带动Figure效率跃升-25030118页
分类:
时间:2025-05-09
标签:
格式:PDF
-
杨昕-AI驱动抖音用户体验中台探索与实践
分类:
时间:2025-05-10
标签:
格式:PDF
-
跨国的AI采用者的肖像公司特征资产的互补性和生产力
分类:
时间:2025-05-10
标签:
格式:PDF
-
OrChechikandDanielFrank-从侦察到毁灭揭露伊朗AgriusAPT最新TTPs
分类:
时间:2025-05-10
标签:
格式:PDF
-
爱立信混合工作模式调查结果
分类:
时间:2025-05-10
标签:
格式:PDF