日立製作所は24日、数百万件の大規模な画像・映像データの中から、指定した画像と類似した画像を1秒以内で高 速検索できる類似画像検索技術を開発したと発表した。類似画像検索技術は「見た目が似ている」画像を検索する技術。画像間の類似性の評価は、画像の色の分布や形状など画像自体が持つ情報を自動的に抽出し、高次元の数値情報として表現した「画像特徴量」に基づいて行われる。類似画像検索技術自体は、すでに実用化されているが、検索時の処理量が大きく、これまで大規模なデータを扱うことは困難だった。
|
今回、日立は、画像データを保存する時に、類似したデータ同士をまとめる「クラスタリング処理」と、画像特徴量のデータをハードディスクドライブ(以下、HDD)に保存する際の記録場所の最適化を行うことにより、高速かつメモリ消費量を抑えた検索ができる技術を開発した。
|
これにより、PCを用いて数百万件規模の画像データの中から類似した画像を検索した場合、1秒以内で検索することが可能となったという。本技術は映像検索にも適用可能で、例えば、10,000時間分の映像の中から、好きな芸能人が出ているシーンを瞬時に検索するといった画像・映像検索アプリケーションが実現できる。防犯用などへの応用も期待されている。
|
通信のブロードバンド化やHDDなどの記憶装置の大容量化、デジタルカメラなどの各種撮像機器の普及により、PCで大量の画像・映像を扱うことができる時代となってきており、今後さらに取り扱うデータ量が増加することが見込まれることから大規模な画像・映像データを有効に利用するため、目的の画像を高速に検索できる技術が求められている。
|
画像検索技術としては、画像自体が持つ視覚情報(色分布、質感、構図など)に基づいて検索を行う「類似画像検索技術」と呼ばれる技術が、すでに実用化されているが、類似画像検索では、検索の対象となる画像から、視覚的な情報を数100次元の数値列データ(画像特徴量)で示し、データ間の「似ている度合い(類似度)」を、この画像特徴量の違い(画像特徴量ベクトル間の距離)で評価する。
|
類似画像検索を行う場合は、この数100次元の画像特徴量の違いを計算する必要があるため、検索対象が数百万件規模になると、その演算量は膨大なものとなる。このため大規模なデータベースの類似画像検索の実現には、検索時間の高速化が課題となっていた。
|
日立は今回、PCを使って数百万件規模の画像・映像データから、1秒以内(数100ミリ秒)で目的の画像と類似した画像の検索が可能な、高速かつ低コストの類似画像検索技術を開発したもので、本技術は画像データを登録する際の画像特徴量データの保存方法を工夫したものであり、値の近い画像特徴量データを一つのグループにまとめる「クラスタリング処理」と、平均画像特徴量の類似したクラスタ同士を近くに配置する最適化処理を特長としている。
|