橦言无忌

一个不想改变世界的程序媛

Align before Fuse-Vision and Language Representation Learning with Momentum Distillation

前言

本文思想

paper
github

基于动量蒸馏的视觉语言表示学习

参考

自然语言处理-多模态-ALBEF:基于动量蒸馏的视觉语言表示学习

// 代码折叠