LLMを人間の好みに沿うように調整する手法として、DPO(Direct Pref...
AIシステムを有害な出力から守りつつ、有用性を維持する方法として、Constit...
大規模言語モデル(LLM)は複雑な推論タスクが苦手とされてきましたが、Chain...
LLMは膨大な知識を持っていますが、リアルタイム情報の取得や計算、外部システムと...
LLMの能力を最大限に活用するために、AIエージェントという概念が注目されていま...
対照学習(Contrastive Learning)は、ラベルなしデータから有用...
SimCLR(Simple Framework for Contrastive ...
知識蒸留(Knowledge Distillation)は、大規模な教師モデルの...
モデル枝刈り(Pruning)は、ニューラルネットワークの不要なパラメータを削除...
ニューラルアーキテクチャ探索(Neural Architecture Searc...