Transformer : LayerNorm (Layer Normalization)

LayerNorm (Layer Normalization)

作成: 2025-06-28
更新: 2025-06-28

y = ( y_1, ‥‥ , y_Ｄ )

数式表現
LayerNorm の理由（技術的理由）
・学習安定性の確保
・構造の繰り返しにおける分布の恒常性
・実験的にも，LayerNorm を通さない Transformer は，