橦言无忌

一个不想改变世界的程序媛

前言

PyTorchImageModels,简称 timm,是一个巨大的 PyTorch 代码集合,包括了一系列:

  • image models
  • layers
  • utilities
  • optimizers
  • schedulers
  • data-loaders / augmentations
  • training / validation scripts

旨在将各种 SOTA 模型整合在一起,并具有复现 ImageNet 训练结果的能力。

github link
hugging face models

作者:Ross Wightman,来自加拿大温哥华。首先致敬大佬!

阅读全文 »

前言

针对的几个挑战性问题

  • 无效的图文之间的强关联假设
  • 预训练的效率低下
  • 模型部署困难

解决问题
提出了BriVL的双塔模型 + 借鉴MoCo的策略 + 一个给予队列的字典 + InfoNCE Loss

模型适用场景
图像检索文本、文本检索图像、图像标注、图像零样本分类、作为其他下游多模态任务的输入特征等。

paper link
code

BriVL,首个中文通用图文多模态大规模预训练模型

阅读全文 »

前言

虚函数可以说是在涉及C++的面试问题中经久不衰的话题了,这里就介绍一下虚函数的概念以及相关的常见问题。

加油~

阅读全文 »

前言

C++中释放内存的方式有 delete 和 delete[] 两种,它们的区别是什么呢?

加油~

阅读全文 »
// 代码折叠