夏源-在医疗健康领域企业大模型RAG优化实践






医疗健康领域大模型RAG优化实践演讲人:夏源百度灵医大模型底座技术负责人CONTENTS目录01医疗健康领域RAG现状与挑战02RAG医疗领域技术优化03RAG医疗落地实践和应用RAG现状和挑战引言RAG技术是否已经“烂大街”?医疗领域RAG技术有什么不一样?RAG技术实际应用的难点和挑战?Naive RAG 技术框架Query理解问题检索召回 & 排序文档文档解析索引构建Prompt构建答案生成大模型ES库/向量库Naive RAG 面临的问题Query理解问题检索召回 & 排序文档文档解析索引构建Prompt构建答案生成大模型ES库/向量库chunk切分不完整文档格式解析错误图像文档解析意图理解错误多意图问题上下文指代不明召回噪声信息关键信息未召回大模型生成“幻觉”层次结构扁平大模型回答片面模型回答安全性关键信息截断证据相关性弱如何解决 Naive RAG的技术问题意图识别多轮改写复杂query拆分证据源预判实体识别和扩展多队列召回向量召回文本召回知识图谱召回Q-TP相关性权威性多样性 证据筛选提取信息归纳答案文档解析文档切片文档挖掘向量索引文本索引内容理解(离线)需求理解检索召回排序 & 相关性LLM 答案生成chunk切分不完整文档格式解析错误图像文档解析意图理解错误多意图问题上下文指代不明召回噪声信息关键信息未召回大模型生成“幻觉”层次结构扁平关键信息截断大模型回答片面模型回答安全性证据相关性弱证据权威性难点和挑战挑战一:如何针对医疗专业领域进行内容理解和建设?挑战二:如何提升在医疗药企领域大模型的专业性?挑战三:如何解决实际企业应用中复杂RAG问题?RAG医疗领域技术优化医疗检索增强RAG 技术架构文档抽取证据聚合RAG大模型理解和推理应用自我反思自我推理Query理解意图识别关键词抽取上下文理解索引自动构建ES检索RAG混合多级循证检索稠密向量检索深度语义排序多源文档召回证据溯源路径检索相关性排序百度灵医大模型底座(LLM)数据库解析版面分析医疗RAG内容理解表格识别文档结构化文字解析字段识别段落识别机器翻译推理检索内容医疗RAG 内容理解和建设患者的病历包含不同的单据,如病案首页、检验报告单、病理报告单、住院诊断书等病案首页检验报告单病理报告单病理报告单医疗大数据治理入院记录病程记录手术麻醉记录出院小结...各种类型的医疗文档和单据,纯文本、表单、图
相关推荐
相关内容
-
腾讯云中国信通院中国通信标准化协会2024年AI大模型应用发展研究报告58页
分类:
时间:2025-05-09
标签:
格式:PDF
-
利用智能视觉组件简化嵌入式视觉开发
分类:
时间:2025-05-09
标签:
格式:PDF
-
俄勒冈州交通规划在快速变化和不确定的时代利用情景规划的案例研究
分类:
时间:2025-05-09
标签:
格式:PDF
-
SiCMOSFET技术进展与发展方向
分类:
时间:2025-05-09
标签:
格式:PDF
-
康嘉种业-每一头猪都代表着康嘉人的尊严
分类:
时间:2025-05-09
标签:
格式:PDF
-
汽车行业周报小米SU7Ultra正式发布Helix带动Figure效率跃升-25030118页
分类:
时间:2025-05-09
标签:
格式:PDF
-
杨昕-AI驱动抖音用户体验中台探索与实践
分类:
时间:2025-05-10
标签:
格式:PDF
-
跨国的AI采用者的肖像公司特征资产的互补性和生产力
分类:
时间:2025-05-10
标签:
格式:PDF
-
OrChechikandDanielFrank-从侦察到毁灭揭露伊朗AgriusAPT最新TTPs
分类:
时间:2025-05-10
标签:
格式:PDF
-
爱立信混合工作模式调查结果
分类:
时间:2025-05-10
标签:
格式:PDF