t_wの輪郭

強化学習報酬制裁
サンクションモデル