Transformer
気温、湿度、気圧、風速 — 気象観測ステーションは毎秒このような多変量時系列デー...
Transformer
機械翻訳モデルに「I love cats」を入力したとき、デコーダが「猫」という...
Transformer
Transformerは自然言語処理の覇者ですが、致命的な弱点があります。Sel...
Transformer
LLMの推論サーバーを運用する際、GPUメモリの使い方が性能を大きく左右します。...
Transformer
LLaMA-70Bのモデルパラメータは、FP16(16ビット浮動小数点)で保存す...
Transformer
Mixture of Experts(MoE)は、ニューラルネットワークの効率を...
Transformer
投機的デコーディング(Speculative Decoding)は、小さなドラフ...
Transformer
Flash Attention は、Transformer のアテンション計算を...
Transformer
GPT-4やGeminiのような最高性能のLLMは、数千億〜数兆のパラメータを持...
Transformer
ChatGPTが「有害な回答を避ける」「ユーザーの意図に沿った回答を生成する」こ...