咨询热线:400-123-4567
您当前的位置: 天博体育 > 新闻中心 > 公司新闻
  NEWS

新闻中心

公司新闻

沪粤联合研发金融知识大模型 在自己擅长的金融知识领域超越了GPT4等

发布时间: 2024-01-27 次浏览

  沪粤联合研发金融知识大模型 在自己擅长的金融知识领域超越了GPT4等尤其是AI大模型技术如何在金融垂直领域应用落地?日前,上海交通大学上海高级金融学院(SAIF)与粤港澳大湾区研究院(IDEA)联合研发出“金融知识大模型”,并发布“金融试题解析”“金融分析计算”和“金融事件分析”三大功能。仅就其金融知识库而言,就囊括了超过20万篇

  最新测试结果表明,金融知识大模型的“垂类”性能突出。不仅在主流金融测试集FinEval上全面超越了现有的主流大模型,而且在金融领域的重要考试方面成绩喜人——譬如,在注册会计师全国统考CPA考试中,全面超越现有的主流大模型,包括GPT3.5和GPT4;在国际通行的金融投资从业者专业资格认证CFA考试中,则全面超越了主流的中文大模型,在大部分科目上跟GPT4互有胜负。

  此次“模拟考”在现场演示了3个场景。第一个场景是求解注册会计师考试CPA例题。CPA题目相对简短,金融知识大模型就定位题干关键词对应的知识点,还针对知识点检索做了特定优化。第二个场景是解答较为复杂的CFA二级分析计算题。金融知识大模型的求解过程,经过OCR图表识别和STEM剪枝过程,以便精简题干。

  第三个场景更具时效性,即针对“2023年中央金融工作会议”的公报内容作深层次的信息检索和归纳整理天博·体育。由此,金融知识大模型构建了以“2023中央金融工作会议”为问题主体的思维导图,并生成了与其相关的子问题。通过意图识别选取相关的子节点,对金融知识库、资讯库进行信息检索天博·体育,实现最终内容生成。

  粤港澳大湾区研究院数字金融首席科学家林舟驰表示,“金融知识大模型”面向金融教育、金融咨询与金融分析这3个主要场景,以金融知识检索、知识问答、信息抽取、意图识别、代码智能和工具调用等能力为支撑。从CPA到CFA的金融试题解析方面,大模型通过题干关键词进行背景知识搜索、相关案例搜索和相关例题搜索,能够根据需要解答问题、对答案进行分析或答疑。

  林舟驰博士解读认为,其背后以金融知识库+大语言模型为底座,取代了传统的单一语言模型底座架构,再搭配金融、、咨询场景的高质量语料进行模型预训练,形成了思维图谱推理技术。这种思维图谱推理技术,能在某种程度上把大模型的推理过程白盒化,通过知识的归纳整理,形成思维图谱,逐点逐层解决一个现实中的金融问题。

  值得一提的是,当推理过程不再是“黑盒”,CPA天博·体育、CFA考试的两个场景中,会计及金融专业学生也可以以交互式学习方式,获得答案的解析以及针对题干内容的答疑,革新了传统的人机教培方式。

  在知识+模型的底座基础上,沪粤研发团队还开发了一系列面向现实场景的工具接口,例如金融信息抽取,可在海量研究报告与新闻材料中抽取有价值的金融常识、金融主体和关系信息,以及金融事件各类观点等等。这些金融信息都被AI解析,并被吸收成为金融知识库的一部分,服务于各类顶层任务。

  目前,这款大模型采用了来自金融教科书、企业财报、企业研报、新闻舆情、法律案例和政府报告等超过160G的高质量金融文本进行增量预训练,还通过30多万条衍生于金融公式、金融试题、金融代码、金融问答、金融表格和金融知识图谱等的高质量指令数据进行有监督微调,有力保证了大模型最终输出内容的可靠性和可控性。

  据悉,目前金融知识大模型还未对外开放,其未来计划的第一阶段,主要以上海高级金融学院的业务场景为落点,在业务中“跑”起来并不断迭代,逐渐在更大范围落地。

 
友情链接
天博tb·体育(中国)官方网站-登录入口

扫一扫关注我们

热线电话:400-123-4567  公司地址:广东省天博·体育登录入口
Copyright © 2012-2025 天博tb·体育(中国)官方网站-登录入口 版权所有HTML地图 XML地图   鲁ICP备16007669号-1