Transformer
投機的デコーディング(Speculative Decoding)は、小さなドラフ...
Transformer
Mixture of Experts(MoE)は、ニューラルネットワークの効率を...
Transformer
Vision Transformer(ViT)は、2020年にGoogleの研究...
Transformer
CLIP(Contrastive Language-Image Pre-trai...
Transformer
マルチモーダルLLM(Large Language Model)は、テキストだけ...
Transformer
LLaVA(Large Language and Vision Assistan...
Transformer
活性化関数はニューラルネットワークに非線形性を導入する重要な要素です。ReLUが...
Transformer
オプティマイザは深層学習モデルの学習効率と最終性能を大きく左右します。SGDから...
Transformer
学習率(Learning Rate)はニューラルネットワークの学習において最も重...
Transformer
勾配クリッピング(Gradient Clipping)は、勾配爆発を防ぐための手...