Transformer
転移学習(Transfer Learning)とファインチューニング(Fine-...
Transformer
LoRA(Low-Rank Adaptation)は、大規模言語モデルを効率的に...
Transformer
KVキャッシュ(Key-Value Cache)は、大規模言語モデル(LLM)の...
Transformer
ビームサーチ(Beam Search)は、機械翻訳やテキスト生成において広く使わ...
Transformer
大規模言語モデル(LLM)がテキストを生成する際、次のトークンの選び方によって出...
Transformer
アテンションマスク(Attention Mask)は、Transformerにお...
Transformer
RoPE(Rotary Position Embedding、回転位置埋め込み)...
Transformer
Flash Attention は、Transformer のアテンション計算を...
Transformer
大規模言語モデル(LLM)は数十億から数千億のパラメータを持ち、単一のGPUメモ...
Transformer
量子化(Quantization)は、ニューラルネットワークの重みや活性化を低精...