メンバー
修士2年
| 塩川 龍次 | ヒューマンインザループ型強化学習によるクレーンの安全アシスト制御 |
| 間庭 卓也 | 自動運転における絶体絶命時の危険回避操作の獲得 |
| 大野 優太 | 長期的視点で学習するTransformerモデル 〜意思決定における重要行動の推定〜 |
| 中条 隼人 | 意思決定タイミングの最適化によるパレート方策の網羅的獲得 |
| 高桑 直大 | 個人の選好ダイナミクス推定による快適なAI共生社会の実現 |
| 杉山 翔湧 | 動的環境における不完全観測の特徴量補完法 |
| 劉 誠 | 拡散モデルによるパレート最適方策の獲得 ~列車自動運転の定時性,安定性,省エネルギーの実現~ |
| 永田 健斗 | 安全で最適な制御を保証する誘導型バリア関数ベースの強化学習 |
| 蓑島 康太 | 学習過程の行動軌跡のランク付けによる自動Reward Shaping ~強化学習の学習効率,収束性向上に向けて~ |
学部4年
| 野尻 健人 | Decision Transformer におけるReturn-to-Go の影響評価 |
| Harits ISMAIL | RLHFによる選好反映度の検証〜PbRLアルゴリズムの性能比較〜 |
| 佐野 優輝 | 列車の回生電力最大化に向けた変電所の電圧制御 |
| 関 柊汰 | 緊急場面における失敗経験の重点学習を用いた危機回避制御の検証 |

