NISS2000仮想研究提案 Aグループ [A3] テーマ:モジュールの混合によるパフォーマンス混合の確認 発表者: 大羽成征 王懐成 根本憲 橋本幸紀 森川幸治 1:導入 春野らによって提案された Multiple Pairs of Forward Inverse Model(MPFIM)は次のようなものであった。 ・運動制御のパフォーマンスはモジュール構造によって担われる。 ・各モジュールは順モデル逆モデルの対で構成された内部モデルであり、フィード バック誤差学習を行なう。 ・モジュール間の競合は、モジュールの適合度によって総和1の責任信号を取り合 うSoftmax関数によって行なわれる。 ・モジュールの適合度は、順モデルの出力する期待誤差によって評価される。 ・システムの出力は、各モジュールの出力に関する重み付き和をとって決める。責 任信号をこの重みとして用いる。 ・モジュールは、責任信号が0から1へ滑らかに変化することで、切り替わる。そ の中途では、モジュールが混合していることになる。 われわれは、人間の脳において行なわれている計算とこのMPFIMとの、本質レベル での相似性の有無を心理物理的実験によって明らかにしたいと考えた。 第2部では上で述べた各要因のなかでも、モジュール間の関係に焦点を合わせ、複 数モジュール間の競合が総和1の責任信号の取り合いによって実現されている様を 心理物理的実験によって検出したい。またその中でもとくに、人間においてモジュ ール出力の混合が有り得るかどうかの検証を目標とする。 2:実験のスキーム 2.1:実験スキーム1 タスクA,B,Cについて、 タスクCが、タスクAとタスクBの中間であるといえるようなものであるとする。 (1)被験者にタスクAを一定時間行なわせ、  内部モデルA(モジュールA)の形成を促す。  また、タスクAの達成度の時間的推移を記録する。 (2)タスクBを一定時間行なわせ、  内部モデルB(モジュールB)の形成を促す。  同様に、タスクBの達成度の時間的推移を記録する。 (3)タスクCを行なわせ、達成度の時間的推移を記録する。 タスクの達成度の時間的推移を学習時定数と呼ぶことにする。 初めて行なうタスクでは脳内に新たな内部モデルを獲得せねばならないために、学 習時定数が長くなることが期待される。またこれに対し、すでに獲得された内部モ デルを使って行なうことのできるタスクは、学習定数が比較的短いものであること が期待される。 そこで、タスクCの学習時定数がタスクA,Bとほぼ同程度であった場合、タスクC において、同レベルのモジュールCが新規に作られたことが示唆される。これに対 して、タスクCの学習時定数が、タスクA,Bと比べ、顕著に小さかった場合、タス クA,Bの学習結果であるモジュールA,Bを用いた効率的な学習がなされたことが示 唆される。 後者は、責任信号のバランスのみによってタスクCが実現されたものとして、 MPFIMの帰結を支持する結果と解釈できる。 2.2:実験スキーム2 前述のスキーム1と同様に、(1)(2)によって、内部モデルA、Bの形成を促す。 (3)タスクCを行なわせそのパフォーマンスを記録する。  (この際、タスク実行回数を少なくして学習が十分に進まないようにする) (4)タスクA’(タスクAと少しだけ異なるタスクであり、モジュールAによっ て担われる)を一定時間行なわせ、モジュールAのシフト(小規模変化)を促す。 (5)再びタスクCを行なわせそのパフォーマンスを記録する。 モジュールAのシフトによって、タスクCのパフォーマンスに影響が出た場合、タ スクCが、モジュールA,Bの混合によって実現されていたことが示唆される。 このスキームにおいて用いられるタスクA,B,Cは以下条件を満たさねばならない。 ・タスクAとタスクBとが、異なるモジュールによって担当されること。 ・タスク間関係をなんらかのパラメータで表現したときに  C=(A+B)/2 を満たすこと。 ・ 各タスクにおいて達成度が評価でき、その大きさの期待値がほぼ等しいこと。も しくは、そうなるような規格化が可能であること。 3:輪投げタスク 以上の要請を満たすタスクの一例として 輪投げタスクを考えた。 タスクA,B,Cは、それぞれ2m,6m,4mの距離にある的に向かって輪を投げて飛ばし、 その結果を的の中心からの誤差で評価する。誤差値は的までの距離を用いて規格化 する。 前述の要請から、タスクAとBとが異なるモジュールによって担当されねばならな いが、それは的までの距離を適切に設定することで実現する。これは次のような予 備実験によって、決定できるであろう。 予備実験 的までの距離を少しずつ増やす、減らすなどの変化をさせて、それに応じた誤差値 の変動を見る。もしある距離において突然不連続的な誤差値増加がみられれば、そ の距離においてモデルの切り替えが生じたことを示唆する。 予備実験によって適切な距離を設定した後、次のような本実験を行なう。 本実験 スキーム1のとおり、タスクAとタスクBにおいて一定時間(誤差値がほぼ収束を みる程度)の学習をさせたのち、タスクCの学習時定数を調べる。 また、コントロール条件はタスクAを一定時間学習させた後、すぐにタスクCを学 習させることである。 この実験によってコントロール条件に比べて、タスクBを間にはさんだほうが学習 時定数が短くなるという結果がでたならば、何らかの形でモジュール間混合が起こ っているものとして、MPFIMを支持する結果を得ることになる。 4:議論 輪投げタスクは、第一部で扱ったマウス操作タスクに比べ、運動時に視覚フィード バックの影響を受けないことによって、系が単純になるメリットがある。 しかし投げるという運動自体が比較的複雑であるために、それをたった一つの順逆 モデル対モジュールで表現することが妥当かどうか、疑問の余地がある。 また、タスクとモジュールとの一対一関係が成立しているか否かを、この実験スキ ームで本当に検証できるものか、いぜんとして疑問が残る。 スキームによりよく合う適切なタスクを他にも探す必要があるだろう。 人間のタスク実行学習のモジュール性に関して、ここで挙げたほかにも様々な観点 が有り得る。モジュール間の階層性・並列・協調・競合・継起性などなど様々な関 係がMPFIMモデルからトップダウン的に導けるが、それらの心理物理的検証は逐一 が今後重要な問題になるだろう。