強化学習論文がIJCNN2021にaccept

奥戸嵩登くん(総研大D4)と山田の下記論文が,IJCNN2021にacceptされました..サブゴール知識を利用する高速強化学習アルゴリズムDTA(dynamic trajectory aggregation)の初のトップカンファレンス論文です.この研究は,奥戸くんの博士論文研究のコアアルゴリズムなので,まずはよかったです.この後,一つ前のアルゴリズムSRSの論文が続きます.

  • Takato Okudo and Seiji Yamada: Reward Shaping with Dynamic Trajectory Aggregation, In Proceeding of 2021 International Joint Conference on Neural Networks (IJCNN2021), online (July 2021) doi:
上部へスクロール