Loading...

热门

文心·CV大模型：基于领先的视觉技术，利用海量的图像、视频等数据，为企业和开发者提供强大的视觉基础模型，以及一整套视觉任务定制与应用能力

AI大模型9个月前发布阿强

文心·CV大模型基于领先的视觉技术，利用海量的图像、视频等数据，为企业和开发者提供强大的视觉基础模型，以及一整套视觉任务定制与应用能力。

VIMER-CAE

视觉自监督预训练模型，创新性地提出“在隐含的编码表征空间完成掩码预测任务”的预训练框架，在图像分类、目标检测、语义分割等经典下游任务上达到SOTA结果

VIMER-UFO

视觉多任务统一大模型，可抽取轻量级小模型，兼顾大模型效果和小模型推理性能，单模型覆盖20+CV基础任务，在28个公开测试集上效果SOTA

VIMER-StrucTexT

端到端文档OCR表征学习预训练模型，创新性地提出“单模态图像输入、多模态表征学习”预训练框架，在5项文档图像理解任务上刷新SOTA结果

VIMER-UMS

行业首个统一视觉单模态与多源图文模态表征的商品多模态预训练模型，在多个商品下游视觉检索、跨模态检索任务上达到SOTA

文心·CV大模型：https://wenxin.baidu.com/wenxin/cv

文心·CV大模型：基于领先的视觉技术，利用海量的图像、视频等数据，为企业和开发者提供强大的视觉基础模型，以及一整套视觉任务定制与应用能力插图

# AI大模型 # AI资源

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

MiniMax开放平台：基于MiniMax端到端的自研多模态大语言模型，能够提供功能丰富的API能力和专区方案

36 0

Seed-TTS：高质量、多功能的语音生成模型，能够生成几乎与人类语音无法区分的语音，支持情感控制、说话人微调等功能

91 0

MMLU Benchmark：一个用于评估多任务语言理解模型性能的基准测试，提供了多个语言理解任务和模型对比，适用于各种需要进行多任务语言理解的场景

37 0

云雀大模型：字节研发的大模型产品，一个自然语言内容生成和内容理解的AI大模型，该模型基于字节机器学习平台开发，它可以通过自然语言处理技术与用户进行对话

116 0

开放智能机器（上海）有限公司openailab：开放智能专注边缘智能计算及应用，致力于推动芯片级算力，算法，工程产品化，行业应用等完整产业链的深度协作

30 0

360智脑：360智脑宣布首发“文生视频”多模态功能，并将“360智脑4.0”接入浏览器、搜索、安全卫士等360全端产品

68 0

暂无评论

暂无评论...