橦言无忌

一个不想改变世界的程序媛

timm库

前言

PyTorchImageModels,简称 timm,是一个巨大的 PyTorch 代码集合,包括了一系列:

  • image models
  • layers
  • utilities
  • optimizers
  • schedulers
  • data-loaders / augmentations
  • training / validation scripts

旨在将各种 SOTA 模型整合在一起,并具有复现 ImageNet 训练结果的能力。

github link
hugging face models

作者:Ross Wightman,来自加拿大温哥华。首先致敬大佬!

一,简介

timm 库实现了最新的几乎所有的具有影响力的视觉模型,它不仅提供了模型的权重,还提供了一个很棒的分布式训练和评估的代码框架,方便后人开发。更难能可贵的是它还在不断地更新迭代新的训练方法,新的视觉模型和优化代码。

但是毫无疑问,训练、测试和维护这些代码库和模型权重需要大量的 GPU (或 TPU) 资源和大量的电力/冷却费用。Ross Wightman 也确实需要额外的资源来提供和训练更多具有更好技术的模型,所以作者打了广告邀请各界人士赞助

二,使用教程

2.1 环境

pytorch docker

// 代码折叠