アライメント | 機械学習と情報技術

DPO（Direct Preference Optimization）の数学的導出と実装

2026年1月13日 NLP

LLMを人間の好みに沿うように調整する手法として、DPO（Direct Pref...

LLM アライメント強化学習機械学習自然言語処理

Constitutional AIとは？原則に基づくアライメント手法を解説

2026年1月12日 NLP

AIシステムを有害な出力から守りつつ、有用性を維持する方法として、Constit...

AI安全性 LLM アライメント機械学習自然言語処理

[data-arkb-linkbox]{cursor:auto}[data-arkb-link][aria-hidden="true"]{visibility:visible;color:transparent;z-index:0;width:100%;height:100%;pointer-events:auto}a.arkb-boxLink__title{text-decoration:underline}