Secure-japan
header


診断
犯罪事例
セキュリティ情報
このサイトについて
  

産総研がモニター映像から人と動作の認識を自動的に行う新方式を開発
~無人監視・認識技術の実用化へ大きな前進~

独立行政法人・産総研(産業技術総合研究所)は24日、大津展之 フェロー(東京大学 特任教授 兼任)らが監視カメラなどで自動監視・認識するうえで最も重要な鍵である「モニター映像から人およびその動作の認識を自動的に行う」新方式を開発したと発表した。これまでに2次元静止画像に対して開発した高次局所自己相関特徴抽出法(以下「HLAC」という)を用いた適応学習型認識方式をさらに動画像に拡張し、立体HLAC(以下「CHLAC」という)に基づき「対象の動作」の特徴を抽出する方法で、非常に汎用的でかつ高速・高精度であることが特徴である。(一部、兼任先の東京大学大学院 情報理工学系研究科での学生指導で実施)。
新方式CHLACは、モニター動画像から個人を識別して異常行動を直ちに検出することができる。本方式を、米国のHumanIDプログラムの一環として米国立標準技術研究所(NIST)が取りまとめている国際的なgait認識のコンペティションのためのテストデータ(HumanID Gait Challenge Dataset)に対して適用した結果、従来手法を大幅に上回る世界最高の認識性能であることが実証された。
新方式CHLACは、人の認識のみならず異常行動の検出や特定した人を追跡する移動体追跡にも適用できるため、ニーズの高い知的監視カメラなどセキュリティ分野における自動(無人)ビデオサーベイランスの研究開発をはじめ、ロボット視覚などコンピュータビジョンの研究開発にも大きく貢献するものと期待される。
今後は、文部科学省の「都市エリア産学官連携促進事業(高度ビデオサーベイランス)」、「科学技術振興調整費・重要課題解決型研究等の推進(交通事故対策技術)」、「21世紀COEプログラム(情報科学技術戦略コア(東京大学大学院情報理工学系研究科の採択テーマ))」に適用し、本方式の実用化に向けた研究開発や対話システム、ロボットなどの「実世界情報システム」分野における視覚への応用を行っていく予定である。
犯罪やテロの増加に伴い、監視カメラによるビデオサーベイランスの研究が盛んである。特に監視カメラの知能化のためには映像中の人および動作の認識や異常行動の検出を自動的に行う技術が重要であり、実用化のニーズは極めて高い。しかしながら従来の手法では実用に足る認識性能が得られていなかった。
従来手法のほとんどは、まず動画から個々の動く物体を切り出し、あらかじめ用意したモデルに照らして対象とする人の認識や動作特徴の抽出を行う手法であり、精度に限界があって計算量も膨大である。また、人の動作の特徴抽出手法としてはオプティカルフロー方式が主流であるが前提条件の成立が厳しく、しかもノイズに弱いなどの理由から実用化には至っていない。
これに対して大津氏らは、これまでに「統計的特徴抽出」の理論的な視点から、2次元静止画像に対して非常に汎用的な高次局所自己相関特徴抽出法(HLAC)を適用して学習適応能力を有する画像認識方式の開発を行っており、これは平成3年に科学技術庁より第50回注目発明に選定されている。今回、これをさらに動画像に拡張した立体HLACに基づく汎用的で高速・高精度な「対象の動作」の特徴を抽出する技術(CHLAC)の開発に成功した。
動画像は、2次元静止画像が時間に沿って並んだ3次元(立体)の数値データである。これらのデータから、特定の対象、例えば歩く人を認識し計測するためには、歩く人の空間における位置情報に依存しない特徴抽出が望ましい(位置不変性という)。立体内に複数個の対象がある場合、全体の特徴値がそれぞれ個別対象の特徴値の和になる加法性を持つと以後の処理が容易となり、認識精度が向上する。さらに特徴抽出方法としては計算量が少なくリアルタイム処理が可能であることが望ましい。
HLACおよびCHLACによる特徴抽出方式は、正にこれらの要請を全て満たす基本的で汎用的な特徴抽出方式となっており、この抽出データと統計的な情報統合手法を組み合わせることにより動画像からの適応学習型汎用物体認識方式が得られるようになった。
今回開発した方式では、動画像から異常行動を直ちに検出することができる。本方式では画像中に複数の対象が有る場合、それぞれの対象の特徴の和が、全体の特徴となる加法性を持つので、通常(正常)動作の特徴ベクトルは特徴空間(251次元)のある部分空間(通常動作部分空間)に分布することになる。従って異常行動は常時、通常動作の学習によって得られる「通常動作部分空間」からの逸脱(その距離を数値化すると、その値)として、直ちに高速かつ高精度に検出・認識される(複数人の場合でも異常値検出力は同じ)。
ここでも、あらかじめ準備しておく対象のモデルや知識は一切不要であり、計算量も一定で少ないためリアルタイム処理が可能であり、自動(無人)ビデオサーベイランスでの異常検出の様々な課題に応用できる。
さらに今回開発した認識技術は、画面を分割しHLACの特徴である加法性を利用することにより移動体の自動追跡も可能である。追跡には、対象の形情報に加えて色情報も重要な要素となるのでHLAC特徴をカラー画像に対応できるように拡張してある。従来手法のほとんどが画像レベルでの照合(テンプレートマッチング)であるため、対象の切り出し誤差(位置ずれを含む)や対象の動作の変化などによって誤った追跡となりがちであった。また対象が一度物陰に隠れる、あるいは他の対象と交差する場合、追跡ができなくなるなどの問題点があった。これに対して本方式は、移動対象の「特徴レベル」での同定・認識に基づく非常に頑健(robust)で安定な追跡法であり、移動体の切り出しも不要で計算量も少なく、リアルタイムでの追跡が可能になった。
今後は、文部科学省の「都市エリア産学官連携促進事業(情報通信:安全・安心な都市生活のためのユビキタス映像情報サーベイランス)」、「科学技術振興調整費(重要課題解決型研究等の推進/交通事故対策技術の研究開発/状況・意図理解によるリスクの発見と回避)」に適用し、本法式の実用化に向けた研究開発を行う予定である。さらに同省の「21世紀COEプログラム(情報科学技術戦略コア(東京大学大学院情報理工学系研究科の採択テーマ))」において対話システムやロボットなどの「実世界情報システム」分野における視覚の研究開発にも本方式を応用する予定である。
本方式は、高性能かつ汎用的であるのでセキュリティや防災などのビデオサーベイランスに関わる応用分野(監視カメラシステム、警備システム、防災監視システムなど)をはじめ、ビデオの自動インデクシング(インデックスを作ること、シーンの変わり目の自動検出・編集)、医療福祉やスポーツ分野(リハビリテーション、動作の矯正、トレーニングシステムなど)、さらには対話システムやロボットの視覚など広くコンピュータビジョンに関係する分野での応用が期待される。


footer