Loading...

文心·CV大模型:基于领先的视觉技术,利用海量的图像、视频等数据,为企业和开发者提供强大的视觉基础模型,以及一整套视觉任务定制与应用能力

AI大模型2个月前发布 阿强
25 0

文心·CV大基于领先的视觉技术,利用海量的图像、视频等数据,为企业和开发者提供强大的视觉基础模型,以及一整套视觉任务定制与应用能力。

VIMER-CAE

视觉自监督预训练模型,创新性地提出“在隐含的编码表征空间完成掩码预测任务”的预训练框架,在图像分类、目标检测、语义分割等经典下游任务上达到SOTA结果

VIMER-UFO

视觉多任务统一,可抽取轻量级小模型,兼顾大模型效果和小模型推理性能,单模型覆盖20+CV基础任务,在28个公开测试集上效果SOTA

VIMER-StrucTexT

端到端文档OCR表征学习预训练模型,创新性地提出“单模态图像输入、表征学习”预训练框架,在5项文档图像理解任务上刷新SOTA结果

VIMER-UMS

行业首个统一视觉单模态与多源图文模态表征的商品多模态预训练模型,在多个商品下游视觉检索、跨模态检索任务上达到SOTA

文心·CV大模型:https://wenxin.baidu.com/wenxin/cv

文心·CV大模型:基于领先的视觉技术,利用海量的图像、视频等数据,为企业和开发者提供强大的视觉基础模型,以及一整套视觉任务定制与应用能力插图
    © 版权声明

    相关文章

    暂无评论

    暂无评论...