QLoRAの理論と実装 — 4bit量子化+LoRAで大規模LLMを効率的にファインチューニング 2026年4月19日 Transformer 65Bパラメータのモデルを単一の48GB GPUでファインチューニングできる —... LLMLoRANF4QLoRAファインチューニング機械学習量子化
【実践】LoRA/PEFTで効率的にLLMをファインチューニングする 2026年2月10日 Transformer LoRA(Low-Rank Adaptation)は、大規模言語モデルを効率的に... LoRAPEFTTransformerファインチューニング大規模言語モデル深層学習