スケーリング則の数学 — Kaplan則とChinchilla則を導出する 2025年11月20日 Transformer スケーリング則(Scaling Laws)は、言語モデルの性能がパラメータ数、デ... LLMスケーリング則深層学習言語モデル計算量