MMDS大阪大学 数理・データ科学教育研究センター
Center for Mathematical Modeling and Data Science,Osaka University

動的構成機能をもつファジィ Q 学習

馬野 元秀 (日立造船株式会社 技術研究所; 大阪府立大学 名誉教授)

大阪大学 数理・データ科学セミナー 数理モデルセミナーシリーズ第15回

動的構成機能をもつファジィ Q 学習

馬野 元秀 (日立造船株式会社 技術研究所; 大阪府立大学 名誉教授)

行動を学習できる手法として、強化学習が注目されている。Q 学習は強化学習の一種で、最もよく使われている学習法である。もともと離散状態にしか適用できない Q 学習を連続状態に適用できるように拡張したファジィ Q 学習が提案されている。そして、それを拡張して、ファジィ集合を全体的に調整する方法も提案されているが、初期のファジィ集合は必要である。我々は、動的な構成機能をもつファジィ Q 学習を提案している。状態がまったくない状況から始めて、必要に応じて状態(ファジィ集合の組)と行動を追加していき、状態のファジィ集合を調整しながら、不要な状態と行動を削除していく手法である。連続空間上の追跡問題に適用した例を示す。

DOWNLOAD PDFposter(167.82KB)
講師: 馬野 元秀 (日立造船株式会社 技術研究所; 大阪府立大学 名誉教授)
テーマ: 大阪大学 数理・データ科学セミナー 数理モデルセミナーシリーズ第15回
日時: 2018年01月16日(火) 16:20-17:50
場所: 大阪大学 基礎工学研究科 J棟1階セミナー室
参加費: 無料
アクセス: 会場までのアクセスは下記URLをご参照ください。
http://www.es.osaka-u.ac.jp/ja/access.html
お問い合せ: 本ウェブサイトの「お問い合せ」のページをご参照ください。