動的構成機能をもつファジィ Q 学習


馬野 元秀 (日立造船株式会社 技術研究所; 大阪府立大学 名誉教授)
  1. MMDSについて
  2. MMDSの教員・組織
  3. MMDSで学びたい方へ
  4. MMDSの活動

  5. 学内向け情報

大阪大学 数理・データ科学セミナー 数理モデルセミナーシリーズ第15回
動的構成機能をもつファジィ Q 学習

馬野 元秀 (日立造船株式会社 技術研究所; 大阪府立大学 名誉教授)

行動を学習できる手法として、強化学習が注目されている。Q 学習は強化学習の一種で、最もよく使われている学習法である。もともと離散状態にしか適用できない Q 学習を連続状態に適用できるように拡張したファジィ Q 学習が提案されている。そして、それを拡張して、ファジィ集合を全体的に調整する方法も提案されているが、初期のファジィ集合は必要である。我々は、動的な構成機能をもつファジィ Q 学習を提案している。状態がまったくない状況から始めて、必要に応じて状態(ファジィ集合の組)と行動を追加していき、状態のファジィ集合を調整しながら、不要な状態と行動を削除していく手法である。連続空間上の追跡問題に適用した例を示す。

download PDF:
PDF:poster (167.8kB)

講 師:
馬野 元秀 (日立造船株式会社 技術研究所; 大阪府立大学 名誉教授)
テーマ:
動的構成機能をもつファジィ Q 学習
日 時:
2018年01月16日(火)16:20-17:50
場 所:
大阪大学 基礎工学研究科 J棟1階セミナー室
参加費:
無料
アクセス:
会場までのアクセスは下記URLをご参照ください。
http://www.es.osaka-u.ac.jp/ja/access.html
お問い合せ:
本ウェブサイトの「お問い合せ」のページをご参照ください。