動的構成機能をもつファジィ Q 学習 │ MMDS：数理・データ科学教育研究センター

動的構成機能をもつファジィ Q 学習

馬野元秀 (日立造船株式会社技術研究所; 大阪府立大学名誉教授)

大阪大学数理・データ科学セミナー　数理モデルセミナーシリーズ第15回

動的構成機能をもつファジィ Q 学習

馬野元秀 (日立造船株式会社技術研究所; 大阪府立大学名誉教授)

行動を学習できる手法として、強化学習が注目されている。Q 学習は強化学習の一種で、最もよく使われている学習法である。もともと離散状態にしか適用できない Q 学習を連続状態に適用できるように拡張したファジィ Q 学習が提案されている。そして、それを拡張して、ファジィ集合を全体的に調整する方法も提案されているが、初期のファジィ集合は必要である。我々は、動的な構成機能をもつファジィ Q 学習を提案している。状態がまったくない状況から始めて、必要に応じて状態(ファジィ集合の組)と行動を追加していき、状態のファジィ集合を調整しながら、不要な状態と行動を削除していく手法である。連続空間上の追跡問題に適用した例を示す。

DOWNLOAD PDFposter(167.82KB)

講師：	馬野元秀 (日立造船株式会社技術研究所; 大阪府立大学名誉教授)
テーマ：	大阪大学数理・データ科学セミナー　数理モデルセミナーシリーズ第15回
日時：	2018年01月16日(火)　16:20-17:50
場所：	大阪大学基礎工学研究科 J棟１階セミナー室
参加費：	無料
参加方法：
アクセス：	会場までのアクセスは下記URLをご参照ください。 http://www.es.osaka-u.ac.jp/ja/access.html
お問い合せ：	本ウェブサイトの「お問い合せ」のページをご参照ください。