橦言无忌

一个不想改变世界的程序媛

前言

文章:Convexifying Transformers: Improving optimization and understanding of transformer networks

essay link

凸优化的角度理解和优化Transformer网络~

阅读全文 »

前言

流量监控

  • MRTG
  • Cacti
  • SmokePing
  • Graphite

性能告警

前言

文章:Transformer with Fourier Integral Attentions

essay link

无参数核估计,Fourier积分原理等跟Transformer关联的文章,似懂非懂啊,老天爷!

阅读全文 »

前言

数学专业课的学习资源,大多是视频,后续会不断增加其他形式~

多年前翘的课,早晚要还回去~

阅读全文 »

前言

文章:ODE Transformer-An Ordinary Differential Equation-Inspired Model for Neural Machine Translation

essay link

ODE 跟Transformer关联的文章,第一次读文章,先看懂!

阅读全文 »
// 代码折叠