畳み込み符号とビタビ復号の理論 — トレリスと動的計画法 2026年3月10日 情報理論 携帯電話で通話するとき、音声データはデジタル化されてから無線回線を通って基地局に... トレリスビタビアルゴリズム動的計画法情報理論畳み込み符号誤り訂正符号
ベルマン方程式の導出と意味 2026年3月4日 強化学習 ベルマン方程式は強化学習の理論的中核をなす方程式です。価値関数の再帰的な関係を記... ベルマン方程式価値反復法動的計画法強化学習方策反復法機械学習
動的計画法(価値反復・方策反復)を解説して実装する 2026年2月25日 強化学習 動的計画法(Dynamic Programming, DP)は、マルコフ決定過程... MDP価値反復動的計画法強化学習方策反復方策評価