画像認識とインスタンスセグメンテーション

インフォグラフィックの各セクションでは、さまざまなソフトウェア企業で使用されている分類を扱っています。

画像解析でのインスタンスセグメンテーションの仕組みはこちらをご覧ください。

インフォグラフィックによると、画像認識技術は技術市場で最も重要な分野の1つです。

2012年、画像認識技術は、米国市場において14億米ドルという途方もない金額を生み出すと予想されています。

2014年には、この市場は約26億米ドルにまで成長すると予想されています。

収益面では、2013年の211億米ドルから2015年には269億米ドルに成長すると予想されています。

次の画像は、画像認識技術の重要性を示しています。


画像認識技術は、コンピューターと情報技術の中で最も急速に成長している分野ですが、画像に関するデータはますます多くなってきています。

画像の量が増えるにつれて、画像を分析し分類する必要性も高まり、そのプロセスはますます複雑になっています。

分類タイプ1.5と分類タイプ2.0の違いについて概要を説明しました。

主な違いは、タイプ2.0では、画像の種類に応じたルールに従って画像を分類しようとする点です。

これにより、分析する画像の数を減らすことができます。

しかし、分類作業には長い時間がかかります。

そのため、分類処理の精度や速度を向上させるための取り組みが複数行われている。

例えば、””How do we make image segmentation simple, fast, and accurate?”” では、固定的なルールセットを使用するアプローチと、柔軟で一般的なルールセットを使用するアプローチの2種類の開発について論じています。


“”分類タイプ2.0と分類タイプ1.5の違いとは?””
ここで重要なのは、この3つの分類には、ルールセットを使用することなど、多くの共通点があることです。

私たちが知る限り、分類タイプには2つの大きな違いしかありません。


分類タイプ1.5では、オブジェクトを他のオブジェクトから分離して考えていない(つまり、カテゴリ内の「オブジェクト」とは考えていない)。


分類タイプ2.0では、オブジェクトの異なる部分を別のオブジェクトと見なします。


ここで重要なことは、分類タイプ1.5では、オブジェクトは、このオブジェクトの一部でないとき、他のオブジェクトから分離されているとみなされることです。

これは分離性と呼ばれるものです。

カテゴリは、画像の「段階」のようなものだと考えることができます。

木の写真を見たとき、「木だ」と判断することもあるが、「木だ」「岩だ」「家だ」「鳥だ」と判断することもある。

つまり、この写真を分類するとしたら、それぞれのパーツを別々のものとして考えなければならないのです。

もし、この写真を「木」と分類するならば、「物」として分類しなければならない。

例えば、対象物は木であったり、岩であったり、家であったり、鳥であったりと、さまざまです。


この分類の大きな違いは、分類するときに、対象物が何であるかということを自分の判断で決めるということです。

分類タイプ1.5では、自分の判断で対象を分類しています。

分類タイプ2.0では、他人の判断で分類します。


上の画像では、「木」という物体を、「木」と分類していることがわかります。