「模倣学習」の版間の差分

編集の要約なし
編集の要約なし
1行目: 1行目:
浅田稔(大阪国際工科専門職大学,大阪大学先導的学際研究機構 共生知能システム研究センター)
<div align="right"> 
内部英治(株式会社国際電気通信基礎技術研究所 脳情報研究所)
<font size="+1">[https://researchmap.jp/minoruasada 浅田稔]</font><br>
''大阪国際工科専門職大学,大阪大学先導的学際研究機構 共生知能システム研究センター''<br>
<font size="+1">[https://researchmap.jp/uchibe 内部英治]</font><br>
''株式会社国際電気通信基礎技術研究所 脳情報研究所''<br>
 
DOI:<selfdoi /> 原稿受付日:2021年9月23日 原稿完成日:2021年9月27日<br>
担当編集委員:[http://researchmap.jp/123qweasd 五味 裕章](NTTコミュニケーション科学基礎研究所 人間情報研究部)<br>
</div>


英:imitation learning
英:imitation learning
イミテーション・ラーニング
浅田稔(大阪国際工科専門職大学、大阪大学先導的学際研究機構 共生知能システム研究センター)
内部英治(株式会社国際電気通信基礎技術研究所 脳情報研究所)
2021年9月23日
{{box|text= 模倣学習とは、「模倣を学習すること」の意味と学習の一形態としての「模倣学習」が考えられる。前者では、模倣することの前提知識や条件が完全に与えられれば、学習する必要はなく、ブラインドコピーすることで終わる。これらの前提知識や条件が不備であるとき、それらを埋めるべき操作としての学習過程が必要となる。後者は、教師あり学習、教師なし学習、強化学習などの代表的な学習のアプローチの中で、従来、教師あり学習の一形態として模倣学習が位置づけられてきたが、近年、強化学習の報酬関数の推定の観点から逆強化学習が注目され、さらに深層学習の各種法の適用により、計算論的観点から模倣学習が見直され、拡張されている。}}
{{box|text= 模倣学習とは、「模倣を学習すること」の意味と学習の一形態としての「模倣学習」が考えられる。前者では、模倣することの前提知識や条件が完全に与えられれば、学習する必要はなく、ブラインドコピーすることで終わる。これらの前提知識や条件が不備であるとき、それらを埋めるべき操作としての学習過程が必要となる。後者は、教師あり学習、教師なし学習、強化学習などの代表的な学習のアプローチの中で、従来、教師あり学習の一形態として模倣学習が位置づけられてきたが、近年、強化学習の報酬関数の推定の観点から逆強化学習が注目され、さらに深層学習の各種法の適用により、計算論的観点から模倣学習が見直され、拡張されている。}}
==はじめに==
==はじめに==