情報工学科
寺西 大
教員紹介
プロフィール
- 【専門分野】
-
○ニューロコンピューティング応用
○適応信号処理
○疎データ計算機トモグラフィー(CT)
- 【担当科目】
- HIT基礎実践A/B/C/D 、 HIT応用実践A/B/C/D 、 離散数学 、 人工知能 、 デジタルシステム設計 、 認知科学
- 【研究テーマ】
-
1.人工知能技術に基づく技能情報の分類・可視化
2.ニューラルネットワークによる疎データCT像再構成手法
3.告知画像の文字領域抽出手法
- 【ひとこと】
工学の基礎を固めて、その上にキラリと個性を光らせましょう。
大きな問題にはしぶとく、笑みを浮かべて立ち向かう「タフな工大生」となってください。
卒業するまでに何か一つ、「手強いけれど、オモロイもの」となる、ライフワークの種を見つけてください。
研究紹介
寺西 大TERANISHI Masaru
情報学部 情報工学科 准教授
熟練者と素人の「技術の差」を、
ニューラルネットワークによって可視化する
PROLOGUE
のこぎりを引いたり、カンナで削ったり、やすりをかけたり。熟練の技術者は、これらの作業を簡単にこなします。それを見た未経験者が「自分にもできるかな」と見よう見まねでやってみても、途中で刃が木材にひっかかったりして、ぎこちない動きしかできません。熟練者と素人の間には、見た目にはわからない大きな差があるのですね。この「見た目でわからない差」をニューラルネットワークによって可視化し、熟練者と比べて自分に何が足りないのか理解できるようにしようと研究しているのが寺西先生です。
三次元測定デバイスで、熟練者の動きを計測。学習者との動きの差を比較
熟練者のやすりがけを見ていると、いとも簡単そうに材料を美しく仕上げてくれます。しかし、その動きを未熟な学習者がまねようとしても、うまくいきません。これは、熟練者と学習者の動きの間に、パッと見ではわからない差があるからです。その差を明確にできれば、どんな努力をすれば熟練者に近づけるのか、学習者にもわかりやすくなるはず。
一方、技術を教える熟練者の側も大変です。学習者が例えば40人いた場合、個別にアドバイスしていたら、時間がいくらあっても足りません。ですが、ある程度動きの傾向が似た者同士をグループ分類しておけば、効率的に指導できるでしょう。
そこで、熟練者と学習者の動きの違いを明示化する仕組みを考えました。最初に、三次元スタイラスというデバイスを使って、熟練者の動作をx軸、y軸、z軸の三次元で計測します。三次元スタイラスは、「押した」「引いた」「触った」という操作感覚を忠実に再現するハプティクスデバイスなので、学習者は熟練者の動きを体感できます。それを体感した上で、学習者が熟練者のようにやすりを動かそうと試みます。しかし完璧な再現は当然できず、やすりの傾きや速度など、さまざまな面に学習者特有の癖が出ます。そのデータを測定し、熟練者データと比較するのです。
SOMというニューラルネットワークで学習者をマッピングし、グループ分け
やすりがけで重要になる、x軸の動きに注目した場合。熟練者は最初素早く、その後ゆっくり動かし、何度やっても崩れません。しかし学習者の場合、やればやるほどぶれていき、熟練者との間に差が出ます。そのデータを基に、SOMというニューラルネットワークを使って、傾向の似た学習者同士をグループ分けするのです。SOMは「自己組織化マップ」と呼ばれ、集団を傾向の似ている者同士で自動分類するのにとても役立ちます。
熟練者のデータから波形を作成し、これを基準として、学習者個々の波形との差分を計算します。この1つの波形は100個の点、すなわち100次元空間の1点なのですが,SOMではこれを波形の近い者同士を二次元平面に配置していきます。中心には熟練者の波形があり、熟練者に近い位置にマッピングされた波形の学習者ほど、技能レベルが高い、ということです。
すると、距離の近い者同士で3~4グループに分かれたマップができあがります。同じグループに属する者は、クセの傾向が近いことを示します。ということは、そのグループに対する改善のポイントも共通するはずなので、指導の効率が上がるわけです。
しかしマップが二次元だと、端っこに行けば行くほど傾向の似通っていない波形が集まってしまいます。これを解消するため右端と左端、さらに上端と下端をつないだドーナツ状の、トーラスなマップにしました。
ものづくりの世界だけでなく、学習・スポーツ分野にも応用可能
トーラスSOMで端っこに変なデータが集まる問題は解消できたのですが、これはドーナツを切り開いて平面にしているので,もともとの中心がわかりづらくなるという問題が発生しました。そこで思い切って、球面にすることを考えました。
球面SOMは熟練者と学習者のデータを球面上に配置しているのですが、こうすると、トーラスのように切り開く必要がなく,球面を回して自由に見られるので、自分が熟練者とどの程度離れているのか、また自分はどんな傾向のグループに属するのか、ひと目でわかるようになりましたね。分類の精度も、トーラスSOMよりかなり向上しています。こうした作業を自在に行ってくれるのが、ニューラルネットワークの性能の優れた点だと言えます。
今後は熟練者や学習者のデータを増やし、さらに学習前と後で技能がどれだけ改善したか、といったことも測っていきたいと思います。三次元スタイラスなどで取得したデータをもとに、熟練者と学習者の差分をニューラルネットワークでマッピングし、学習や指導に活かす。この手法は、ものづくりの世界だけでなく、さまざまな学習や、スポーツにおける技術の取得などにおいても応用できるでしょう。そのために必要な研究を重ねていきたいと思います。