(1)プランニング技術と強化学習の統合
本柱では,機械学習の機能を持つSoarアーキテクチャの開発に取り組む.Soarプロジェクトは知能一般のアーキテクチャの構築を目指して始められ,様々な研究がなされてきた.汎用的問題解決器として提案されたSoarは現在も多くのアプリケーションで利用されている.Soarでは問題空間を予め記号で定義するため,オペレータや世界に関するモデルが既知である問題に適用でき,抽象的なレベルでのプランニングが可能である.記号で閉じた世界において高速なプランニングが可能だが,帰納的な学習機構を持たないため,状態遷移が未知である環境や物体を含むような実世界には適用が困難である.
本柱では,強化学習のモデルをSoarアーキテクチャに取り入れ,学習機能を持つ問題解決器を提案する.強化学習は試行錯誤を繰り返し望ましい状態に対して報酬という数値化された信号を受け取ることで学習する.このサイクルから新たなプロダクションルールを生成し,Soarの行うプランニングに用いることを目指す.
(2)分散型重み付き制約充足アルゴリズムとその応用
分散型重み付き制約充足アルゴリズムの応用として,複数の知的エージェントによる看護婦勤務スケジューリングシステムの実装を行なう.本システムでは,カレンダー上に配置されるイベントを変数として考え,複数のイベント間や,ある特定のイベントにおいて満たされるべき条件を制約とする.そして,イベントの重要度ごとに対応する制約に重みを与え,分散重み付き制約充足問題(Distributed Valued Constraint Satisfaction Problem:DVCSP)として考える.
本システムの具体的な応用例としては,看護婦の勤務表スケジューリングを考える.この場合,各イベントは日勤,夜勤,深夜勤の3つの値をとる.また,担当の看護婦もパラメータとして持つ.このときの制約には,連続の勤務などの禁止事項や,看護婦個人の要望などが考えられる.各個人の要望に関しては,DVCSPとして定式化することでユーザはプライベートな制約を反映させることが可能となる.もちろんこの際制約の情報は公開されることが無い.
|