首页 > 热点

世界实时:最大CLIP!LAION发布CLIP的扩增定律

2022-12-30 01:30:53


【资料图】

点蓝色字关注“机器学习算法工程师”

设为星标,干货直达!

近日,LAION等机构在Reproducible scaling laws for contrastive language-image learning发布了CLIP的扩增定律(scaling law),其中最大的CLIP为ViT-H/14,基于LAION-2B数据集训练,可以在ImageNet1K数据集上到78.0%的zero-shot准确度,性能超过OpenAI目前开源的CLIP L/14,和Meta AI的FLIP Huge模型性能相当,但是模型已经开源在https://github.com/LAION-AI/scaling-laws-openclip。

论文的实验采用开源数据集LAION-400M和LAION-2B数据集,训练框架采用开源的OpenCLIP,所以论文的实验是可以复现的。训练在1520 NVIDIA A100 GPUs上进行,采用PyTorch DDP分布式训练策略,采用混合精度(但是fp16会不稳定,所以采用bf16,或者基于TF32的float32),训练的batch size在 86-88K之间。实验的总体结论是:扩增定律也明显适用CLIP,当扩增模型,训练数据和算力时,模型在下游任务上有一致性的提升。但是不同的训练数据集表现出不同的扩增系数:OpenCLIP的模型(基于LAION-2B数据集)在图文检索任务上有较大的扩增系数,而OpenAI CLIP模型(基于私有的WebImageText 400M数据集)在zero-shot分类任务上有较强的扩增系数。这个结论和FLIP的结论比较吻合,这说明训练数据集对CLIP的性能确实有比较大的影响。用论文结论的一句话来说就是:Scaling behavior depends on task type and pre-training dataset。更多内容可见论文:https://arxiv.org/abs/2212.07143
上一篇 下一篇
热文推荐 更多

世界实时:最大CLIP!LAION发布CLIP的扩增定律

2022-12-30

前沿热点:大汉软件再添发展硕果!

2022-12-29

头条焦点:把善良留给懂得感恩的人!

2022-12-29

2023辽视春晚祝福征集活动开启(附活动时间+参与入口)|环球快消息

2022-12-29

安鑫花网贷逾期23年还不起影响征信吗-全球速读

2022-12-29

矩阵股份:公司从事空间设计与软装陈设业务,目前尚未从事体育场馆的设计 快讯

2022-12-29

警惕血氧仪“非理性”涨价

2022-12-29

俄乌冲突悬而未决欧洲能源困局难解-天天热资讯

2022-12-28

江西:“小萝卜”种出乡村振兴“大梦想”

2022-12-28

12月28日广州白云区同和街四价HPV疫苗预约限户籍吗?

2022-12-28

羊腿用烤箱烤多久:焦点快看

2022-12-28

2023元旦贵阳共赴山海鹿溟山个人插画展信息

2022-12-27

天天亮点!星宇股份董秘回复:公司目前采用的是财务集中核算处理

2022-12-27

天天快播:异动快报:惠博普(002554)12月27日9点40分触及涨停板

2022-12-27

中科创达: 《章程(草案)(GDR上市后适用)》及其附件修订对比表_世界最新

2022-12-26

力诺特玻董秘回复:中硼硅近期有两个项目点火,分别是中硼硅模制瓶项目和中硼硅拉管项目

2022-12-26

商务预报:12月12日-18日百家农副产品批发市场食用农产品交易量变化情况

2022-12-26

为什么羽丝棉被不能暴晒? 快讯

2022-12-25

【时快讯】尊享贷网贷逾期4个月影响征信吗

2022-12-25

今亮点!上海迪士尼乐园门票将涨价 迪士尼玩偶都有哪些

2022-12-24