要点:
1、百川智能发布了基础模型第三代版本Baichuan3,医疗场景、文学创作和逻辑推理能力均获得升级和突破。
2、Baichuan3在医疗领域的评测成绩超越了GPT-4水平,各项评测能力大幅超越GPT-3.5,表现出卓越的逻辑思考和问题解决技能。
3、百川智能Baichuan3模型在MMLU测试集、CMMLU和GAOKAO等中文任务评测中成绩均超越GPT-4,显示出超千亿大模型的强大实力。
1月29日 消息:百川智能最新发布了基础模型第三代版本Baichuan3,该模型在医疗场景、文学创作和逻辑推理能力等方面均获得了突破性升级。Baichuan3在医疗领域的评测成绩超越了GPT-4水平,各项测能力大幅超越了GPT-3.5,表现出卓越的逻辑思考和问题解决技能。同时,Baichuan3模型在MMLU测试集、CMMLU和GAOKAO等中文任务评测中成绩均超越GPT-4,显示出超千亿大模型的强大实力。
值得注意的是,百川智能的这一代超千亿大模型,在医疗相关评测任务中取得的结果实在令人瞩目,中文相关评测任务超过了GPT-4水准,英文相关评测任务中,也大大缩短了与SOTA的距离。Baichuan3在文学创作方面也表现不俗,但在多轮对话任务上还存在一定的局限性。综合各项数据和具体效果来看,Baichuan3已经完成了全方位升级,在中文能力上有着明显的超越表现。
对于Baichuan3能在中文医疗场景的表现能超过GPT,百川方面并未公布模型具体参数,但明确表示了采用了业内认可的暴力美学,参数出涌现。另外,百川智能在数据的优化和采样方面也有所创新,Baichuan3逐个击破了训练过程中可能面临的问题,进行优化,这才有了评测集上的亮眼成绩。
需要指出的是,百川智能在模型训练过程中采用了渐进式初始化方法和细粒度监控等措施,保证Baichuan3的稳定训练。整体来看,百川智能的路线和OpenAI的路线一致,即参数出涌现,同时进行优化和创新。
原文地址:https://www.chinaz.com/2024/0129/1593891.shtml