新华社研究院:2023人工智能大模型体验报告2.0






1中国企业发展研究中⼼新华社国家⾼端智库分中⼼人工智能大模型体验报告2.0新华社研究院中国企业发展研究中心2023年08月2报告综述在2023年6月首次发布的《人工智能大模型体验报告》基础之上,本次测评在题目设计、对标Benchmark(人类)、打分权重、专家测评团队四大维度进行了全面升级。在题目设计方面,测评题目由300道扩展至500道,并进一步完善了题目分类;在对标Benchmark方面,本次测评将接受过高等教育的人类作为对照,来考评大模型真实能力;在打分标准上,本次测评根据对产业、生活的实际价值,对四大测评维度进行了权重设计;在测评团队方面,本次测评特邀北京大学文化与传播研究所及其他业界、学界专家全程参与。通过本次测评发现,与2023年6月相比,当前中国大模型产品进步显著。但与接受过高等教育的人类相比,大模型在智商、情商等方面还存在一定程度差距。具体来看,科大讯飞的星火在工作提效方面优势明显;百度文心一言地基深厚、基础能力仍处领军水准;商汤商量则在情商方面表现优秀;智谱AI的ChatGLM整体表现优秀。在本次体验测评的基础上,研究团队将继续深耕,加强在大模型安全可解释性、工作提效能力、实际落地情况、产业优秀案例等维度上的探索与研究,欢迎持续关注。3目录•2.0版本大模型综合指数•2.0版本测评细分维度指数及评述大模型市场综述大模型厂商整体测评2.0版本厂商优秀答案展示目录020103•大模型发展进程•大模型应用发展建议•大模型未来发展趋势•2.0版本大模型测评规则•大模型2.0版本测评题目展示401.大模型成为AI大规模落地拐点5大模型发展进程中国大模型发展现状中国大模型发展热度依旧,天眼查数据显示,截至2023年上半年,与“大模型”直接相关的融资事件超20起,其中包含光年之外、面壁智能等明星级创业企业;从被投企业的地域分布来看,北京、上海以及杭州位居前列,特别是北京,融资事件数量超10起,凸显出北京在人工智能领域的领先地位。越来越多的企业和学术界开始关注如何将大模型与实际应用场景相结合,实现真正的商业化应用。具体来说探索主要围绕研究层面和应用层面:•研究层面,中国大模型在科研方面已形成涵盖理论、方法、软硬件的体系化能力,学术界和产业界共同参与,形成更加完善的理论框架。•应用层面,目前大模型已开始渗透到各行各业,实现商业化应用。超过半数的大模型实现开源。大模型
相关推荐
-
2025-03-31 1457
-
2025-04-01 1719
-
2025-03-26 1214
-
2025-03-27 885
-
2025-03-30 1439
-
2025-03-28 1080
-
2025-03-28 431
-
2025-03-28 337
-
2025-04-01 883
-
2025-03-29 353
相关内容
-
腾讯研究院:人机共生-大模型时代的AI十大趋势观察(2023)
分类:机构报告
时间:2025-04-01
标签:大模型
格式:PDF
-
中国信通院:2023大模型落地应用案例集
分类:机构报告
时间:2025-03-31
标签:大模型
格式:PDF
-
华为云:预训练大模型白皮书(2022)
分类:机构报告
时间:2025-03-30
标签:大模型
格式:PDF
-
阿里研究院:2024大模型训练数据白皮书
分类:机构报告
时间:2025-03-26
标签:大模型
格式:PDF
-
商汤科技:2024大模型赋能下的AI 2.0数字人平台白皮书
分类:机构报告
时间:2025-03-28
标签:大模型
格式:PDF
-
爱分析:2024大模型应用实践报告
分类:机构报告
时间:2025-03-27
标签:大模型
格式:PDF
-
CMF:2023中国宏观经济专题报告:大模型:原理、进展及其影响
分类:机构报告
时间:2025-04-01
标签:大模型
格式:PDF
-
新华社研究院:2023人工智能大模型体验报告2.0
分类:机构报告
时间:2025-03-30
标签:大模型
格式:PDF
-
海尔智家:2023智能家电与生成式人工智能大模型-创新与发展白皮书
分类:机构报告
时间:2025-03-31
标签:大模型
格式:PDF
-
人工智能行业:华为盘古大模型相关梳理
分类:券商研报
时间:2025-03-30
标签:大模型
格式:PDF