強化学習PPOで衛星姿勢制御を学習させる — 理論と実装 2026年5月19日 強化学習・宇宙制御 地球観測衛星のカメラを目標地点に向ける、深宇宙探査機のアンテナを地球に正確に指向... PPOクォータニオン姿勢制御宇宙AI強化学習衛星