邵坤_基于MLLM的智能手机代理基准测试离线微调和在线优化

3.0 2025-05-14 78 0 5512 KB 28 页 PDF
侵权投诉
邵坤_基于MLLM的智能手机代理基准测试离线微调和在线优化
邵坤_基于MLLM的智能手机代理基准测试离线微调和在线优化
邵坤_基于MLLM的智能手机代理基准测试离线微调和在线优化
邵坤_基于MLLM的智能手机代理基准测试离线微调和在线优化
邵坤_基于MLLM的智能手机代理基准测试离线微调和在线优化
摘要:

Toward generalist App agent in open-ended world:benchmark, model, and optimization邵坤华为诺亚决策推理实验室Q1Q3202320242023.07•HarmonyOS 4引入全新的小艺,基于盘古大模型并结合丰富场景数据精调。•集成文本生成、知识搜索、信息概括、意图理解,调用各类APP服务,打造系统级的智能体验。2023.10•小米将大模型技术提升至集团战略层面,成为全球首个在端侧运行大模型的厂商。•初始应用场景为语音助手,旨在广泛影响小米终端用户2023.11•OriginOS4集成了自研的蓝心大模型,端云结合,包含5款自研大模型,全面覆盖核心场景。•蓝心小V基于蓝心大模型开发,提供全局智能辅助功能,成为用户的专属私人助理2024.01•强调了AI化系统功能的重要性,从日常功能着手,实现大模型能力的积累和深度融合。•该技术策略包括对话增强、个性专属服务和端云协同,致力于打造生态系统并全面赋能智慧交互体验。2024.01•新系统以平台级AI为核心,引入端侧大模型,通过深度语义理解和意图识别,转变为个人助理。•具备多模态能力,基于多模态意图识别引擎和意图分析决策平台。2024.01•重点介绍的“即圈即搜”是在多种操作场景中可便捷触发的AI功能。•新交互基于谷歌智能镜头实现,是谷歌SGE(生成式AI搜索)的进一步延展。2024.06•Apple提出与系统紧密结合的系统级AI。iOS原生应用的端侧AI以使用自研Siri能力为主,在云侧需要开放域问题理解及内容创作时接入ChatGPT。Q2Q42023Q3终端Agent布局伊始2024Q1各厂陆续推出终端Agent2024Q2Apple Intelligence 发布终端成为Agent最重要的应用场景终端Agent 技术全景图超级对齐超长/多模态上下文多模态融合(文本/图像/音频/视频)结构化指令遵从All-in-One模型(语音/图片/视频/文本)模型压缩技术(量化)架构工具调用(泛化性强)端侧多模态模型参数高效微调多样化任务微调高效轻量数据管理轨迹数据高效获取半自动化数据构建多源反馈微调对齐输入数据传感器数据感知(MLLM 融合感知)隐私端侧Agent决策/执行端侧Agent环境信息感知用户数据感知(Agent推荐)信息来源不同感知融合(软件

展开>> 收起<<
邵坤_基于MLLM的智能手机代理基准测试离线微调和在线优化

共 28 页,预览3页

还剩25页未读, 继续阅读

声明:企商查报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
作者: 分类: 属性:28 页 大小:5512 KB 格式:PDF 时间:2025-05-14

开通VIP享超值会员特权

  • 多端同步记录
  • 高速下载文档
  • 免费文档工具
  • 分享文档赚钱
  • 每日登录抽奖
  • 优质衍生服务
/ 3
客服
关注