新闻中心
天博体育官网入口【五号雷达-数据快讯】金融领域中文语言理解评测数据集阿里云、苏州大合推出了CFLUE(Chinese Financial Language Understanding Evaluation)天博体育官网入口,这是一个新颖的、全面的评估基准,旨在评估大型语言模型在中文金融语境中的理解和处理能力天博体育官网入口。CFLUE通过两个主要维度-
知识评估部分包含超过38,000个多项选择题,这些题目选自15种不同的金融资格模拟考试,旨在测试语言模型的答案预测和推理能力。每个问题都伴随有解释,有助于深入评价模型的推理过程。
应用评估部分则提供超过16,000个实例,覆盖文本分类、机器翻译、关系抽取、阅读理解和文本生成等五种经典NLP任务,这些实例源自现有共享任务或由专业人员标注的真实数据。
整体而言,CFLUE为了解和提升中文金融领域LLMs的能力提供了多角度的见解,并通过CFLUE呼吁对这些模型的能力进行更全面细致的评估。研究团队期望,CFLUE不仅能促进对现有模型的深入了解,还能推动中文金融领域语言模型发展的新步伐天博体育官网入口。目前,CFLUE V1.0 的评估数据集将向公众提供,未来计划不断更新版本并推出集成的平台化评估服务,旨在为整个行业提供全面的一站式评价解决方案。
扫一扫关注我们