中新网大连5月9日电 (记者 杨毅)大连市新冠肺炎疫情防控总指挥部综合协调组9日发布通告,为进一步加强...
中新网广州5月9日电(记者 方伟彬 王华)广州市9日召开疫情防控新闻发布会,8日12时至今,广州无新增本...
中新网广州5月9日电 题:这家人三代种桑养蚕半世纪 带领全村人走上致富路 中新网记者 许青青 驱车从348...
(抗击新冠肺炎)济南有序恢复堂食 初中毕业年级启动复课 中新网济南5月9日电 (记者 赵晓)5月8日0时至24...
中新网北京5月9日电 (记者 陈杭)北京市疾病预防控制中心副主任、全国新型冠状病毒肺炎专家组成员庞星...
(资料图片仅供参考)
记者从度小满获悉,近日,度小满正式开源国内首个千亿级中文金融大模型——“轩辕”。
据介绍,轩辕大模型是在1760亿参数的Bloom大模型基础上训练而来,在金融名词理解、金融市场评论、金融数据分析和金融新闻理解等任务上,效果相较于通用大模型大幅提升,表现出明显的金融领域优势。在金融场景中的任务评测中,轩辕全面超越了市场上的主流开源大模型,赢得了150次回答中63.33%的胜率,充分凸显了其在金融领域的显著优势。在通用能力评测中,轩辕有10.2%的任务表现超越ChatGPT 3.5,61.22%的任务表现与之持平,涉及数学计算、场景写作、逻辑推理、文本摘要等13个主要维度。
为了提升轩辕大模型对金融领域问题的理解能力,度小满将自身业务中积累的金融领域的千亿tokens的中文预训练数据集用来训练模型。该数据集涵盖了金融研报、股票、基金、银行、保险等各个方向的专业知识。经过清洗和标注的高质量数据集,不仅在通用性方面与ChatGPT达到持平成为可能,且显著提升了模型在金融垂直领域的性能。
目前,千亿级的轩辕模型已可以在Huggingface中申请下载,面向所有金融机构开放。
“轩辕大模型是经度小满业务场景中积累的金融数据训练而来的,对金融相关问题的理解比通用大模型更有优势。”度小满CTO许冬亮说,我们把大模型能力开放给金融机构,有利于推动大模型在金融行业的应用,降低大模型的应用门槛,提升金融行业智能化水平。
对于轩辕大模型开源后,对金融机构的意义。许冬亮认为,生成式大模型在内容生成与创作、信息摘要与总结、知识理解与问答、自然交互与对话等方面具备非常出色的能力,在金融场景中会有广泛的应用。(□记者 沈寅飞 北京报道)
标签: