フジタ シゲル
Shigeru Fujita
藤田 茂 所属 千葉工業大学 情報変革科学部 認知情報科学科 千葉工業大学 情報科学研究科 情報科学専攻 職種 教授 |
|
言語種別 | 日本語 |
発行・発表の年月 | 2024/02/15 |
形態種別 | 学術雑誌 |
査読 | 査読あり |
標題 | 非対照学習にRepresentation Learning via Invariant Causal mechanismsを用いることによる背景情報にまどわされない世界モデル強化学習法 |
執筆形態 | 共著 |
掲載誌名 | 日本知能情報ファジィ学会誌 |
掲載区分 | 国内 |
出版社・発行元 | 日本知能情報ファジィ学会 |
巻・号・頁 | 36(1),129-139頁 |
総ページ数 | 10 |
担当区分 | 最終著者 |
著者・共著者 | 仁科京介・藤田茂 |
概要 | 強化学習の手法には,環境を単純で正確なダイナミクスモデル(世界モデル)として学習し,コンパクトな潜在空間で試行錯誤する手法がある.しかし,再構成誤差を用いて世界モデルを学習しているため,視覚環境が複雑になると,性能が低下する問題がある.これに対して,対照学習で世界モデルを学習させることで,視覚環境が複雑でも性能の低下を軽減した.しかし,バッチサイズを小さくすると性能が低下する課題が残されている.本研究では,非対照学習を用いて世界モデルを学習する手法を提案する.これにより,視覚環境が複雑なタスクにおいても性能が低下する課題を解決することができると考えた.また,視覚情報に関する頑健性を高めるためにタスクには関係のない背景情報による影響を抑制する損失関数を導入した.その結果,通常の背景の場合,6タスク中4タスクで,背景を複雑化した場合は,6タスク中5タスクで提案手法の方が高い性能を示した |
researchmap用URL | https://www.jstage.jst.go.jp/article/jsoft/36/1/36_571/_article/-char/ja/ |