您的位置:首页 > 新闻 > 正文

三大能力、十大维度!元保聚焦保险领域评估大模型价值

2023-10-26 19:43:26   来源:网络  阅读量:5841   会员投稿

2023年,ChatGPT横空出世,让世界认识了AIGC的魔力,也在国内掀起了一场关于大模型的竞争,国内主要科技公司基本开始下场制作自己的大模型。如今,大半年已经过去,已经有许多人工智能大模型开始陆续面世。为了探究这些大模型在实际场景的应用潜力,国内领先的保险科技平台——元保,联合国内保险科技研究机构——分子实验室,共同发布了《人工智能大模型保险行业应用评测报告》(以下简称《报告》),评测其在保险领域的应用价值。

根据《报告》显示,元保联合分子实验室对包括ChatGPT3.5、ChatGPT4、Claude-1、Claude-2、清华智谱ChatGLM130B、百度文心一言、阿里通义千问、科大讯飞星火、360智脑、昆仑万维天工等市场上十大主流的大模型进行了测评。同时,《报告》还特邀国内知名高校专家学者、中国大地财产保险股份有限公司、众惠财产相互保险社等保险公司的专业人员共同调研并撰写完成。

对于《报告》的价值和借鉴意义,清华大学金融科技研究院副院长、中国保险与养老金研究中心主任魏晨阳给出了高度的评价,他表示:“对大模型的评测工作,在全球范围都是一个意义重大的事情。结合金融领域一个重要板块(保险)的大模型评测,其实更具有特殊的意义。包括AI在内的科技赋能,核心在于结合具体应用场景时,模型是否在实操层面、核心业务的前沿,真正有实用价值。”

在测评维度层面,《报告》从常用的保险业务场景中抽离出三大能力,即专业知识问答能力、营销服务应用能力、合规风控应用能力,基本上涵盖大模型在保险领域的主要应用方向。综合各问题回答表现的平均分,10个主流大模型在医疗知识、保险常识、保险法律知识领域表现普遍较好,在智能核保、智能理赔、话术优化上表现不尽如人意,在营销服务应用能力上表现参差不齐,而国内大模型的表现要强于国外大模型。

总结来说,当下头部大模型在专业知识问答上已有较强应用能力,可直接使用程度很高,但是仍需要在营销话术、理赔建议、场景识别等方面进行提升,而元保联合分子实验室发布的这份保险行业首份大模型评测报告《报告》,则是一定程度上消除了保险大模型市场的信息不对称,对于保险机构选择大模型厂商、深度应用大模型具有非常大的指导意义。

版权声明: 本网站部分文章和信息来源互联网,并不意味着赞同其观点或证实其内容的真实性,不构成投资建议。如转载稿涉及版权等问题,请立即联系管理员,我们会予以改正或删除相关文章,保证您的权利!
版权所有: 中国新闻观察网 (2012- )  备案号:沪ICP备2022019539号-11