NLP
RLHF(Reinforcement Learning from Human F...
Transformer
LoRA(Low-Rank Adaptation)は、大規模言語モデルを効率的に...
NLP
埋め込みベクトル(Embedding)は、テキストや画像などのデータを高次元のベ...
Transformer
KVキャッシュ(Key-Value Cache)は、大規模言語モデル(LLM)の...
Transformer
ビームサーチ(Beam Search)は、機械翻訳やテキスト生成において広く使わ...
Transformer
大規模言語モデル(LLM)がテキストを生成する際、次のトークンの選び方によって出...
Transformer
アテンションマスク(Attention Mask)は、Transformerにお...
Transformer
RoPE(Rotary Position Embedding、回転位置埋め込み)...
Transformer
Flash Attention は、Transformer のアテンション計算を...
Transformer
大規模言語モデル(LLM)は数十億から数千億のパラメータを持ち、単一のGPUメモ...