Open4

RoPE のメモ

syoyosyoyo

2 word で 2D で embedding を扱うとする. 2D 回転行列を使って position encoding する

回転項を対角配置することで n 次元に一般化して拡張できる

syoyosyoyo

RoPE + linear Attention による最終的な Attention 計算式は eq. 19 となりスッキリ

syoyosyoyo

回転行列使うと

f(x, m) x f(y, n) = g(x, y, m - n)

と, 内積計算が相対量(m - n)での計算にできて都合が良い