GPT(Generative Pre-trained Transformer)は...
プロンプトエンジニアリング(Prompt Engineering)は、大規模言語...
In-Context Learning(ICL)は、大規模言語モデル(LLM)が...
RLHF(Reinforcement Learning from Human F...
KVキャッシュ(Key-Value Cache)は、大規模言語モデル(LLM)の...
ビームサーチ(Beam Search)は、機械翻訳やテキスト生成において広く使わ...
大規模言語モデル(LLM)がテキストを生成する際、次のトークンの選び方によって出...
アテンションマスク(Attention Mask)は、Transformerにお...
RoPE(Rotary Position Embedding、回転位置埋め込み)...
Flash Attention は、Transformer のアテンション計算を...