Loading...

热门

C-Eval：一个适用于大语言模型的多层次多学科中文评估套件，可以评估模型在不同领域和任务上的性能，并提供结果提交功能

AI大模型2个月前发布阿强

C-Eval是一个适用于大语言模型的多层次多学科中文评估套件，旨在提供一个全面的评估框架，以评估中文语言模型在不同领域和任务上的性能。

C-Eval有哪些功能？

1. 多层次评估：C-Eval提供了多个层次的评估指标，包括整体评估、领域评估和任务评估，可以全面评估模型在不同层次上的表现。

2. 多学科评估：C-Eval涵盖了STEM（科学、技术、工程和数学）、社会科学、人文科学和其他领域的评估指标，可以评估模型在不同学科上的表现。

3. 结果提交：用户可以通过C-Eval的结果提交功能，提交模型的预测结果进行评估，并获得相应的评估分数。

应用场景：

C-Eval适用于评估中文语言模型在各种任务和领域上的性能，包括但不限于文本生成、问答系统、对话系统等。

C-Eval：https://cevalbenchmark.com/static/leaderboard_zh.html

C-Eval：一个适用于大语言模型的多层次多学科中文评估套件，可以评估模型在不同领域和任务上的性能，并提供结果提交功能插图

# AI大模型 # AI资源

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

Microsoft 365 Copilot：大型语言模型（LLM）的强大功能与 Microsoft Graph 和 Microsoft 365 应用中的数据相结合，将你的文字变成地球上最强大的生产力工具

52 0

合合TextIn平台：专业可靠的计算机视觉和机器学习服务平台，提供证件识别,银行卡识别,票据识别,表格识别,文档识别等海量OCR识别

32 0

智源“悟道”人工智能大模型：一款基于深度学习技术的开源大型语言模型，具有强大的自然语言处理能力，可应用于文本生成、信息检索、问答系统等多个领域

51 0

旷视科技Face⁺⁺人工智能开放平台：为您提供人脸识别，换脸，银行业OCR等各类人体，图像，文字识别功能服务，让你的应用读懂世界

53 0

文心·CV大模型：基于领先的视觉技术，利用海量的图像、视频等数据，为企业和开发者提供强大的视觉基础模型，以及一整套视觉任务定制与应用能力

25 0

封神榜大模型：是中文最大的开源预训练模型体系，提供多模态、知识检索、代码生成等先进模型技术，适用于自然语言处理、图像处理和代码生成等应用场景

52 0

暂无评论

暂无评论...