動的構成機能をもつファジィ Q 学習
馬野 元秀 (日立造船株式会社 技術研究所; 大阪府立大学 名誉教授)
大阪大学 数理・データ科学セミナー 数理モデルセミナーシリーズ第15回
動的構成機能をもつファジィ Q 学習
馬野 元秀 (日立造船株式会社 技術研究所; 大阪府立大学 名誉教授)
行動を学習できる手法として、強化学習が注目されている。Q 学習は強化学習の一種で、最もよく使われている学習法である。もともと離散状態にしか適用できない Q 学習を連続状態に適用できるように拡張したファジィ Q 学習が提案されている。そして、それを拡張して、ファジィ集合を全体的に調整する方法も提案されているが、初期のファジィ集合は必要である。我々は、動的な構成機能をもつファジィ Q 学習を提案している。状態がまったくない状況から始めて、必要に応じて状態(ファジィ集合の組)と行動を追加していき、状態のファジィ集合を調整しながら、不要な状態と行動を削除していく手法である。連続空間上の追跡問題に適用した例を示す。
DOWNLOAD PDFposter(167.82KB)講師: | 馬野 元秀 (日立造船株式会社 技術研究所; 大阪府立大学 名誉教授) |
---|---|
テーマ: | 大阪大学 数理・データ科学セミナー 数理モデルセミナーシリーズ第15回 |
日時: | 2018年01月16日(火) 16:20-17:50 |
場所: | 大阪大学 基礎工学研究科 J棟1階セミナー室 |
参加費: | 無料 |
参加方法: | |
アクセス: | 会場までのアクセスは下記URLをご参照ください。 http://www.es.osaka-u.ac.jp/ja/access.html |
お問い合せ: | 本ウェブサイトの「お問い合せ」のページをご参照ください。 |