単眼動画像を用いた視線方向の推定
谷内田研究室 大重 卓也
1.はじめに
人間同士のコミュニケーションにおいて相手がどのあたりを見ているのかというこ
とが、言葉以外の情報として利用されているように、マンマシンインタフェースにお
いても視線方向を利用することができれば、より使いやすい自然なインタフェースを
構築することが可能であろう。現在視線方向を検出する方法では頭部に計測機器を装
着したり、目に近赤外光などの特別な光源を照射する必要がある。本研究のような視
線推定方法は、一般的なビデオカメラで撮影した動画像を用いることにより、特殊な
装置が必要でなくなるため、高齢者や身体障害者の周囲とのコミュニケーションや、
人間の体調や心理的な特性などの観測、バーチャルリアリティーへの応用,読書、読
譜など視線と興味の関係の研究など様々な応用が考えられる。
2. 全体概要と前提条件
本研究ではまず、色彩画像から顔の発見、追跡をおこなう。次に発見された顔にお
いて顔器官の位置関係から顔の向きの推定を行う。さらに、目領域中の瞳の位置を検
出する。顔の向きと瞳の位置情報を統合することによって、視線方向を推定する。
なお本研究では、以下のことを前提条件とする。
- 単眼動画像を用いる。
- 顔の向き、瞳位置、及び視線の推定のすべてにおいて、水平方向の回転のみを考える。
- 実装するのは一個人向けのシステムである。
- 照明の変化等、著しい環境の変化は起こらないとする。
3. 視線方向の推定
顔の発見と追跡については、当研究室ですでに提案されている手法を用いる。YUV
色空間において肌色はUV平面にまとまりのある分布を示す。そこで、UV平面上に肌色
モデルをつくり、肌色領域を抽出する。次に、面積、縦横比を定めた顔形状モデルに
当てはめ、顔領域を発見する。さらに、カメラを制御して顔の追跡を行う。
水平方向に回転する顔の向きを求めるには、普遍的で、かつ画像処理的にも検出や
すい2つの特徴点が必要である。また向きの検出精度を上げるために、特徴点間の距
離ができるだけ大きいものがよい。そこで、発見された顔の中から特徴点として両目
の位置を求め、顔の向きを推定する。
視線方向を推定するためには瞳の動きを追跡しなければならない。そのために、目
領域内で瞳領域を発見し、目領域内での瞳中心の相対位置を求める。
次に、視線方向と瞳の動きの関係を求めるため、常に正面の1点を注視しながら顔
を回転させる実験をおこなった。その結果、顔の向きと瞳の位置の関係は線形近似で
きることがわかった。つまり、正面を注視したときの瞳の位置と観測された瞳の位置
のずれから視線方向が推定される。
4. まとめ
本研究では、単眼画像から得られる情報のうち、顔の向き、及び目領域の中におけ
る瞳の位置を用いて、人物の視線方向を推定する方法を提案した。さらに一連のシス
テムとして実装した。今後の課題として定量的な精度評価とより安定した瞳領域の抽
出を行いたい。