田昕晖-云数据仓库ByteHouse架构下的RAG技术实践与性能优化






云数据仓库 ByteHouse 架构下的 RAG 技术实践与性能优化演讲人:田昕晖火山引擎 / ByteHouse 技术团队目录RAG 相关技术简介高性能向量检索技术全文检索 & 混合检索GraphRAG 实践Conclusion & DiscussionRAG 相关技术简介Naive RAGHybrid SearchRRF: (Reciprocal Rank Fusion)•基于排名重排•同时考虑语义及关键字信息 GraphRAG文本 -> 大模型 -> 图结构检索关联性信息,全局信息Q: Which public figures are repeatedly mentioned across various entertainment articles?Agentic RAGhttps://langchain-ai.github.io/langgraph/tutorials/rag/langgraph_agentic_ragAdaptive RAGJeong, Soyeong, et al. "Adaptive-rag: Learning to adapt retrieval-augmented large language models through question complexity." arXiv preprint arXiv:2403.14403 (2024).Zhao, Siyun, et al. "Retrieval Augmented Generation (RAG) and Beyond: A Comprehensive Survey on How to Make your LLMs use External Data More Wisely." arXiv preprint arXiv:2409.14924 (2024).RAG 相关技术需求要解决的问题:如何让大模型利用外部知识库,回答符合预期的问题?• Memory Engineering•如何获取准确的相关数据•如何让大模型回答的答案有效利用检索数据•性能数据处理:•文本切分•向量提取•Rerank•...高性能检索技术:•向量检索(Dense & Sparse)•全文检索(关键词搜索)•图检索•结构化信息检索•其他可以基于问题检索答案的相关技术 数据管理及操作基础机制:容错、鉴权、
相关推荐
相关内容
-
腾讯云中国信通院中国通信标准化协会2024年AI大模型应用发展研究报告58页
分类:
时间:2025-05-09
标签:
格式:PDF
-
利用智能视觉组件简化嵌入式视觉开发
分类:
时间:2025-05-09
标签:
格式:PDF
-
俄勒冈州交通规划在快速变化和不确定的时代利用情景规划的案例研究
分类:
时间:2025-05-09
标签:
格式:PDF
-
SiCMOSFET技术进展与发展方向
分类:
时间:2025-05-09
标签:
格式:PDF
-
康嘉种业-每一头猪都代表着康嘉人的尊严
分类:
时间:2025-05-09
标签:
格式:PDF
-
汽车行业周报小米SU7Ultra正式发布Helix带动Figure效率跃升-25030118页
分类:
时间:2025-05-09
标签:
格式:PDF
-
杨昕-AI驱动抖音用户体验中台探索与实践
分类:
时间:2025-05-10
标签:
格式:PDF
-
跨国的AI采用者的肖像公司特征资产的互补性和生产力
分类:
时间:2025-05-10
标签:
格式:PDF
-
OrChechikandDanielFrank-从侦察到毁灭揭露伊朗AgriusAPT最新TTPs
分类:
时间:2025-05-10
标签:
格式:PDF
-
爱立信混合工作模式调查结果
分类:
时间:2025-05-10
标签:
格式:PDF