DPO(Direct Preference Optimization)の数学的導出と実装 2026年1月13日 NLP LLMを人間の好みに沿うように調整する手法として、DPO(Direct Pref... LLMアライメント強化学習機械学習自然言語処理
Constitutional AIとは?原則に基づくアライメント手法を解説 2026年1月12日 NLP AIシステムを有害な出力から守りつつ、有用性を維持する方法として、Constit... AI安全性LLMアライメント機械学習自然言語処理