模倣学習
浅田稔(大阪国際工科専門職大学,大阪大学先導的学際研究機構 共生知能システム研究センター) 内部英治(株式会社国際電気通信基礎技術研究所 脳情報研究所)
英:imitation learning {{模倣学習とは,「模倣を学習すること」の意味と学習 の一形態としての「模倣学習」が考えられる.厳密な区 別があるわけではないが,本項目では便宜的に分けて 説明する.前者では,模倣することの前提知識や条件 が完全に与えられれば,学習する必要はなく,ブライン ドコピーすることで終わる.これらの前提知識や条件 が不備であるとき,それらを埋めるべき操作としての 学習過程が必要となる.後者は,教師あり学習,教師 なし学習,強化学習などの代表的な学習のアプローチ の中で,従来,教師あり学習の一形態として模倣学習 が位置づけられてきたが,近年,強化学習の報酬関数 の推定の観点から逆強化学習が注目され,さらに深層 学習の各種法の適用により,計算論的観点から模倣学 習が見直され,拡張されている.本項目後半では,そ れらについて概説する.}}