M 機械学習と情報技術
Guides
877 記事 20 ドメイン
  • All
  • 数学
  • 確率・統計
  • 物理学
  • 力学
  • 電波通信
  • 電子工学
  • 光学
  • 材料工学
  • 航空宇宙
  • 制御工学
  • 機械学習
  • CS・プログラミング
  • 宇宙推進
  • 宇宙ロボティクス
  • 宇宙AI
  • 宇宙通信
  • 宇宙持続可能性
  • ISRU・宇宙製造
  • 小型衛星
  • 先進ミッション

A3C(Asynchronous Advantage Actor-Critic)の理論

2026年3月5日 強化学習
A3C(Asynchronous Advantage Actor-Critic)...
A2CA3CActor-CriticAdvantage関数強化学習機械学習非同期学習

DQN(Deep Q-Network)の理論と実装

2026年3月5日 強化学習
Q学習は強力なアルゴリズムですが、状態空間が大きい(あるいは連続的な)問題ではQ...
Deep Q-NetworkDQNExperience ReplayTarget Network強化学習機械学習

PPO(Proximal Policy Optimization)の理論と実装

2026年3月5日 強化学習
PPO(Proximal Policy Optimization)はOpenAI...
Actor-CriticGAEPPOProximal Policy OptimizationTRPO強化学習機械学習

Q学習とSARSAの理論と実装

2026年3月4日 強化学習
動的計画法による方法(価値反復法、方策反復法)は環境モデル(遷移確率 $P$ と...
Q学習SARSATD学習ε-greedy強化学習機械学習

マルコフ決定過程(MDP)の定式化

2026年3月4日 強化学習
強化学習の理論的基盤となるのがマルコフ決定過程(MDP)です。MDPはエージェン...
MDPマルコフ決定過程価値関数強化学習方策機械学習

ベルマン方程式の導出と意味

2026年3月4日 強化学習
ベルマン方程式は強化学習の理論的中核をなす方程式です。価値関数の再帰的な関係を記...
ベルマン方程式価値反復法動的計画法強化学習方策反復法機械学習

方策勾配法の理論と実装

2026年3月4日 強化学習
Q学習やSARSAなどの価値ベースの手法は価値関数を学習し、そこから方策を導きま...
REINFORCEベースライン強化学習方策勾配定理方策勾配法機械学習

動的計画法(価値反復・方策反復)を解説して実装する

2026年2月25日 強化学習
動的計画法(Dynamic Programming, DP)は、マルコフ決定過程...
MDP価値反復動的計画法強化学習方策反復方策評価

モンテカルロ法による強化学習を解説して実装する

2026年2月25日 強化学習
モンテカルロ法(Monte Carlo method, MC法)は、環境のモデル...
ε-greedyエピソードモンテカルロ法強化学習探索方策評価

TD学習(Temporal Difference Learning)の理論と実装

2026年2月25日 強化学習
TD学習(Temporal Difference Learning)は、モンテカ...
TD(0)TD学習TD誤差ブートストラップ強化学習方策評価

投稿のページ送り

1 2 次の記事 →

Domains

  • 数学
  • 確率・統計
  • 物理学
  • 力学
  • 電波通信
  • 電子工学
  • 光学
  • 材料工学
  • 航空宇宙
  • 制御工学
  • 機械学習
  • CS・プログラミング
  • 宇宙推進
  • 宇宙ロボティクス
  • 宇宙AI
  • 宇宙通信
  • 宇宙持続可能性
  • ISRU・宇宙製造
  • 小型衛星
  • 先進ミッション

Tags

機械学習深層学習統計的検定線形代数確率分布統計学材料力学TransformerLLM数学確率過程多変量解析微積分因果推論確率論

About

航空宇宙の研究者が、理工系の基礎から最先端の宇宙技術までを数式とコードで解説します。

M 機械学習と情報技術

航空宇宙の研究者が運営する理工系技術ブログ。 大学教養〜専門レベルの数学・物理・工学を「数式の導出 + Python実装」で解説します。

基礎科学

  • 数学
  • 確率・統計
  • 物理学
  • 力学
  • 制御工学
  • 機械学習

工学

  • 電波通信
  • 電子工学
  • 光学
  • 材料工学
  • 航空宇宙
  • CS・プログラミング

宇宙技術

  • 宇宙推進
  • 宇宙ロボティクス
  • 宇宙AI
  • 宇宙通信
  • 宇宙持続可能性
  • ISRU・宇宙製造
  • 小型衛星
  • 先進ミッション
  • ホーム
  • プライバシーポリシー
  • お問い合わせ
© 2026 機械学習と情報技術. All rights reserved.