大模型时代下的生物医学文本挖掘初步探索




大模型时代下的生物医学文本挖掘初步探索罗 凌信息检索研究室计算机科学与技术学院大连理工大学2024年6月16日YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024生物医学文本挖掘l生物医学文本挖掘:将人工智能技术(自然语言处理技术和机器学习方法)应用于生物医学领域进行文本挖掘,提升健康医疗领域智能化与信息化的程度。2YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024生物医学关系抽取发展趋势-DDI为例l药物-药物关系抽取(Drug-Drug Interaction, DDI): 单一实体关系类型; 句子级关系360657075808590952015201620172019202020212023DDI (Segura-Bedmar et al., 2013)F1Feature-based SVMGraph Kernel-based methodHierarchy Bi-LSTMs +Att.+SDPBioBERTPubMedBERTDESC+MOL+SciBERTLlama2-13b tuning(Zhou et al, 2023, medrxiv)YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024生物医学关系抽取资源建设l现存生物医学关系抽取数据集:Ø单一实体/关系类型Ø句子级别关系l现实场景下,关系涉及多种实体对,并且存在跨句子关系 l大模型存在数据泄露的可能4需要一个更全面、更贴合现实场景、更新的生物医学实体关系抽取数据集YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024丰富类型的关系抽取数据集BioREDlBioRED: Ø600 PubMed 摘要Ø20,419 实体提及,3,869 唯一IDØ6,503 关系l特性:Ø六种
相关推荐
-
2025-05-13 19936
-
2025-05-15 19943
-
2025-05-13 19950
-
2025-05-15 17939
-
2025-05-13 19833
-
2025-05-14 19537
-
2025-05-14 18531
-
2025-05-15 18933
-
2025-06-05 465
-
2025-06-05 301
相关内容
-
甲子光年2025年DeepSeeK开启AI算法变革元年报告16页
分类:机构报告
时间:2025-05-13
标签:
格式:PDF
-
新战略咨询2024移动机器人AGV_AMR专用激光雷达产品发展蓝皮书31页
分类:机构报告
时间:2025-05-15
标签:
格式:PDF
-
鼎帷咨询2025年DeepSeek战略创新分析报告-围绕DeepSeek尖刀点加速打造AI产业刀锋链39页
分类:机构报告
时间:2025-05-13
标签:
格式:PDF
-
少年商学院2025年DeepSeek中小学生使用手册81页
分类:机构报告
时间:2025-05-13
标签:
格式:PDF
-
英普利集团2025企业出海白皮书中东篇精编版39页
分类:机构报告
时间:2025-05-14
标签:
格式:PDF
-
火山引擎2024火山引擎视频云实践精选集224页
分类:机构报告
时间:2025-05-15
标签:
格式:PDF
-
曼昆律所2024年Web3.0区块链项目出海法律白皮书71页
分类:机构报告
时间:2025-05-14
标签:
格式:PDF
-
CyberRobo2024全球人形机器人产品数据库报告-人形机器人洞察研究BTIResearch99页
分类:机构报告
时间:2025-05-15
标签:
格式:PDF
-
2025泡泡玛特POP MART品牌手册
分类:
时间:2025-06-21
标签:
格式:PDF
-
利用人工智能技术全面应对电子邮件威胁
分类:
时间:2025-06-21
标签:
格式:PDF