オートマトンを用いた実時間ジェスチャ認識
谷内田研究室 石田 郁代
1. はじめに
人が身振り手振りで意志を表現するジェスチャは,人の直観的な理解に働きかけるために,余計な負担を感じずに自然に理解できることが多い.そこで,計算機への入力にジェスチャをもちいる研究が近年盛んにおこなわれている.
しかし,ユーザによって身体の大きさ,服装などの条件が様々に変化するため,計算機にジェスチャを認識させることは容易ではない.また,毎回同じジェスチャをユーザに求めることができないことも,認識を困難にさせている原因の一つである.
そこで本論文では,統計的手法を用いて実画像で入力されるジェスチャを実時間で認識する手法を提案する.
2. システムの概要
ジェスチャゲームシステムは,人物の全身画像から,アッパーパンチ,ストレートパンチ,アンダーパンチ,キックのジェスチャを実時間で認識し,実際にTVゲームの操作をおこなうためのシステムである.認識処理の流れを図1に示す.
図1. ジェスチャゲームシステムの認識手順
3. 従来の認識部
ジェスチャ認識は,個人ジェスチャモデルと入力画像の相違度D(T)をもちいて実現される.
図2. パンチ認識部のオートマトン
従来のジェスチャ認識部では,ストレート,アッパー,アンダー3種のパンチそれぞれについて図2のようなオートマトンを用意し,各オートマトンが独立してジェスチャ認識をする.このオートマトンの遷移は,相違度D(T)としきい値との大小比較によりおこなわれる.従来の認識部には以下のような問題点が存在する.
- ユーザの服装などの条件によって得られる相違度は変化するにも関わらず,オートマトンの遷移条件である相違度のしきい値は,経験的に決められた定数である.そのため,コントラストが低い服装の場合,相違度が低くなるために認識率に極端な低下がみられる.
- 各ジェスチャは独立した複数のオートマトンにより同時に認識されていた.そのため,異なるジェスチャがほぼ同時刻に認識されることがあった.これは一般に人間の場合には起こり得ないことである.
4. 新しい認識方法
従来の認識部でみられた問題点を改善するため,統計的手法を用い,オートマトンの遷移条件を改良した認識法について提案を行なう.
- ユーザの服装などの条件によって起こる相違度の変化に対応するために,新たな認識部を提案する.具体的には,認識の前段階において,ユーザにそれぞれのジェスチャを行なってもらい,得られた相違度の分布を認識に用いる.
- 各ジェスチャの状態をも認識のための手がかりに用いるようなオートマトンに改良する.
5. 実験及び考察
色の濃い服と薄い服を着たユーザに対して,認識実験を行なった.
表1 従来の認識部による認識結果
表2 新しく提案する手法による認識結果
6. 結論
本論文では,個人ジェスチャテンプレートモデルと人物の実画像との相違度を統計的手法で解析し,オートマトンを用いて人物ジェスチャを実時間で認識する手法を提案した.また,実験により提案手法の有効性を示した.