首页 > 资讯 > 财经 > 正文

环球即时看!中国工业互联网研究院发布通用人工智能大模型工业测试结果

2023-06-29 16:47:13来源:新华财经

新华财经北京6月29日电 在工业和信息化部科技司的指导下,由中国工业互联网研究院牵头成立的通用人工智能与工业融合创新中心6月28日发布大模型工业知识问答测试结果,旨在助力人工智能深度赋能制造业,推动工业经济高质量发展。

图:6月2日,中国工业互联网研究院牵头成立通用人工智能与工业融合创新中心,以上为相关领导、专家、企业家代表出席通用人工智能与工业融合创新中心成立仪式。


(相关资料图)

参与报告论证的包括:中国工程院院士唐立新、王国栋,外籍院士焦礼成、张大庆、刘江川,ACM\IEEE Fellow 刘云浩、刘劼、张燕咏、杨铮等,共13位业界顶级专家。该报告针对包括电子设备制造、装备制造、钢铁等八个细分行业,通过设置主观、客观、自主认知和悖论等多方面问题,进行大模型测试。

图:五位中外院士、八位ACM\IEEE Fellow、13位业界顶级专家联合论证。

报告总体显示,通用大模型在工业知识问答领域整体处于探索阶段,GPT4表现最为优异。头部国产大模型表现亮眼,整体水平与GPT3.5持平,多措并举或可实现赶超。

图:大模型工业领域知识问答测评综合结果

大模型对八个细分行业的知识问答能力呈现出明显差异性,其中,电子、装备、钢铁和石化相对较好,采矿、电力、建材和纺织相对不足。

图:大模型在电子、装备、钢铁、采矿行业表现。

具体到国产大模型,文心一言、ChatGLM、360智脑在电子行业中表现优异;文心一言、360智脑、ChatGLM在装备行业评分领先;文心一言、ChatGLM、星火大模型在钢铁行业成绩突出;文心一言、360智脑、星火大模型在采矿行业名列前茅。

图: 大模型电力、石化、建材、纺织行业表现。

在电力行业,文心一言、ChatGLM、天工大模型居于前列;在石化行业文心一言、360智脑、从容大模型处于领先;在建材行业,文心一言、星火、ChatGLM评分较高;纺织行业ChatGLM、文心一言、360智脑优势明显。

图: 大模型自我知识盲区鉴别能力

图: 大模型对输入内容的合理性判断能力

报告显示,在模型自我知识盲区鉴别能力与抗污染问题分析能力方面,GPT4表现出较高的水平,能够自己主动承认不理解的问题以及识别出大部分的逻辑谬误。相较而言,国产大模型提升空间较大。

下一步,通用人工智能与工业融合创新中心将在工业与信息化部科技司的指导下,周期性围绕大模型知识能力、鲁棒性、安全性等专题开展后续评估工作,为政府提供决策依据,为产业提供赋能导向,为企业提供转型方法,为用户提供应用参考,助力构建通用人工智能赋能制造业新优势。

编辑:罗浩

关键词:

责任编辑:孙知兵

免责声明:本文仅代表作者个人观点,与太平洋财富网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
如有问题,请联系我们!

关于我们 - 联系方式 - 版权声明 - 招聘信息 - 友链交换 - 网站统计
 

太平洋财富主办 版权所有:太平洋财富网

中国互联网违法和不良信息举报中心中国互联网违法和不良信息举报中心

Copyright© 2012-2020 太平洋财富网(www.pcfortune.com.cn) All rights reserved.

未经过本站允许 请勿将本站内容传播或复制 业务QQ:3 31 986 683