基于逻辑闭环检验的大型视觉语言模型幻觉缓解

3.0 2025-05-12 68 0 4853 KB 20 页 PDF
侵权投诉
基于逻辑闭环检验的大型视觉语言模型幻觉缓解
基于逻辑闭环检验的大型视觉语言模型幻觉缓解
基于逻辑闭环检验的大型视觉语言模型幻觉缓解
摘要:

Logical Closed Loop: Uncovering Object Hallucinations in Large Vision-Language ModelsNew Laboratory of Pattern Recognition (NLPR), State Key Laboratory of Multimodal Artificial Intelligence Systems (MAIS), Institute of Automation, Chinese Academy of Sciences (CASIA)Qiang LiuYSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP20242Promising LVLMspBackgroundpLarge language models (LLMs) like GPT-4, Llama-3, and Claude, have showcased impressive abilities.pEmpowered by LLMs, large vision-language models (LVLMs) are facilitated to perform strong multimodal understanding and reasoning, e.g. MiniGPT-4, InstructBLIP, LLaVA, and QWEN-VL.InstructBLIP (NIPS 2023)LLaVA (NIPS 2023)YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP20243Hallucinations in LVLMsYSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP2024YSSNLP20244Related WorkpRepresentative WorkpHigh-quality pre-trained and instruction tuning.pM

展开>> 收起<<
基于逻辑闭环检验的大型视觉语言模型幻觉缓解

共 20 页,预览3页

还剩17页未读, 继续阅读

基于逻辑闭环检验的大型视觉语言模型幻觉缓解
基于逻辑闭环检验的大型视觉语言模型幻觉缓解
基于逻辑闭环检验的大型视觉语言模型幻觉缓解
声明:企商查报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
作者: 分类:机构报告 属性:20 页 大小:4853 KB 格式:PDF 时间:2025-05-12

开通VIP享超值会员特权

  • 多端同步记录
  • 高速下载文档
  • 免费文档工具
  • 分享文档赚钱
  • 每日登录抽奖
  • 优质衍生服务
/ 3
客服
关注