16,040
回編集
細 (→模倣の構造) |
細編集の要約なし |
||
1行目: | 1行目: | ||
浅田稔 | <div align="right"> | ||
内部英治 | <font size="+1">[https://researchmap.jp/minoruasada 浅田稔]</font><br> | ||
''大阪国際工科専門職大学,大阪大学先導的学際研究機構 共生知能システム研究センター''<br> | |||
<font size="+1">[https://researchmap.jp/uchibe 内部英治]</font><br> | |||
''株式会社国際電気通信基礎技術研究所 脳情報研究所''<br> | |||
DOI:<selfdoi /> 原稿受付日:2021年9月23日 原稿完成日:2021年9月27日<br> | |||
担当編集委員:[http://researchmap.jp/123qweasd 五味 裕章](NTTコミュニケーション科学基礎研究所 人間情報研究部)<br> | |||
</div> | |||
英:imitation learning | 英:imitation learning | ||
{{box|text= 模倣学習とは、「模倣を学習すること」の意味と学習の一形態としての「模倣学習」が考えられる。前者では、模倣することの前提知識や条件が完全に与えられれば、学習する必要はなく、ブラインドコピーすることで終わる。これらの前提知識や条件が不備であるとき、それらを埋めるべき操作としての学習過程が必要となる。後者は、教師あり学習、教師なし学習、強化学習などの代表的な学習のアプローチの中で、従来、教師あり学習の一形態として模倣学習が位置づけられてきたが、近年、強化学習の報酬関数の推定の観点から逆強化学習が注目され、さらに深層学習の各種法の適用により、計算論的観点から模倣学習が見直され、拡張されている。}} | {{box|text= 模倣学習とは、「模倣を学習すること」の意味と学習の一形態としての「模倣学習」が考えられる。前者では、模倣することの前提知識や条件が完全に与えられれば、学習する必要はなく、ブラインドコピーすることで終わる。これらの前提知識や条件が不備であるとき、それらを埋めるべき操作としての学習過程が必要となる。後者は、教師あり学習、教師なし学習、強化学習などの代表的な学習のアプローチの中で、従来、教師あり学習の一形態として模倣学習が位置づけられてきたが、近年、強化学習の報酬関数の推定の観点から逆強化学習が注目され、さらに深層学習の各種法の適用により、計算論的観点から模倣学習が見直され、拡張されている。}} | ||
==はじめに== | ==はじめに== |