メンバー
修士2年
| 塩川 龍次 | ヒューマンインザループ型強化学習によるクレーンの安全アシスト制御 |
| 間庭 卓也 | 自動運転における絶体絶命時の危険回避操作の獲得 |
| 大野 優太 | 長期的視点で学習するTransformerモデル 〜意思決定における重要行動の推定〜 |
| 中条 隼人 | 意思決定タイミングの最適化によるパレート方策の網羅的獲得 |
| 高桑 直大 | 個人の選好ダイナミクス推定による快適なAI共生社会の実現 |
| 杉山 翔湧 | 動的環境における不完全観測の特徴量補完法 |
| 劉 誠 | 拡散モデルによるパレート最適方策の獲得 ~列車自動運転の定時性,安定性,省エネルギーの実現~ |
| 永田 健斗 | 安全で最適な制御を保証する誘導型バリア関数ベースの強化学習 |
| 蓑島 康太 | 学習過程の行動軌跡のランク付けによる自動Reward Shaping ~強化学習の学習効率,収束性向上に向けて~ |
学部4年
| 野尻 健人 | Transformer を用いた制御系の学習を加速する『褒め方の匙加減』 ~敵対的逆強化学習による推定報酬の導入~ |
| Harits ISMAIL | Preference-based 強化学習における選好の評価フレームワーク ~人間の好みを説明する物理量の同定~ |
| 佐野 優輝 | 回生電力活用の最大化に向けた変電所間の協調型出力制御 |
| 関 柊汰 | 学習収束後の失敗経験の追加学習による危険回避制御の性能改善 ~失敗を活かすタイミングの実験的考察~ |

