お問い合わせ

NOTICE

2016/09/12

物体認識まとめ

物体認識まとめ

現在Eagle Eyeでは顔認識と連携したデモを作成しておりますが、人物以外の「物体」も検出ができるような「物体認識」API, ソフトウェアについてインターネット上で調べられる限りの物体認識の情報をまとめてみましたので公開致します。

物体認識は顔認識と異なり、ほとんどがRESTで提供されており、一部のOSSのエンジンでGPUアクセラレート可能なオンプレ型式での提供となっていることから、今回はRESTだけではなくオンプレでもテストを行ってみました。

ここでは折角ですので自社のリソースを使用し、物体認識のテストも行えるだけ行って結果も紹介しております。テストに使用した写真はインターネットニュースサイトの写真です(ネットで「Uptown-Sweats-by-Kiya-Tomlin-Sandra-Cadavid-boutique-opening.jpg」と検索すれば表示されると思いまので、興味あれば探してみてください)。

 

テスト内容は上記写真を何の加工もなく、各APIで何もカスタマイズ、チューニングせずにどれだけの認識精度を出せるかを実施しました。

取得したい内容は物体の名称やカテゴリ、画像そのものの説明となります。今回は結果表示にばらつきが多く、採点が難しいので、今回はランキング型式にはしておりません。

検証実施者の私見としては、「Clarifai」の画像タグが思った以上に精度が高く、また広範囲にデータを拾っているように見えました。ただしConfidenceが表示されないので、どこまで自信があるのかが不明ですが・・・。

またTensorFlowも折角検証環境にGPUがあったため、GPU版でテストを行ってみました。

学習を全く行っていないため精度は低いのですが、やはりノートPCと比べると数十倍の実行速度で分析完了しました。

今後、まだまだ色々なAPIやソフトウェアが物体認識の世界でも出てくると思いますので、引き続きトラッキングしたいと思います。

 

以下の表、結果につきましても株式会社イグアスが独自に調査、検証、テスト実施、結果判定を行ったものであり、いかなる企業、団体とも関連なく行ったものです。また順位やスコア出力は全て株式会社イグアスが独断で行ったものであり、下記内容、結果から発生するいかなる損失や損害につきましても一切保証するものではありません。

各会社名、商品名、サービス名、ロゴは、各会社のものとなります。

 

企業名 国籍 初出 サービス名称 枝名称 提供形態 API形式 独自画像の学習 認識度 検出内容 課金体系 URL 独自デモ結果
物体/説明 物体/分類 物体/タグ ランドマーク 顔/性別 顔/年齢 顔/有名人 文字 ロゴ XXX 無料枠 有償
IBM Watson Group
(Parted of IBM)
US 2014 IBM Watson Developer Cloud Visual Recognition SaaS REST N/A             250API/D
1,000Lrn/M
$0.002/ObjAPI
$0.004/FaceAPI
Watson Developer Cloud
building: 0.35

Microsoft US 2015 Cognitive Services Computer Vision API SaaS REST N/A     5,000API/M $1.50/1,000API
(10API/s)
Computer Vision API
"captions": [ { "text": "a group of people standing next to a stuffed animal", "confidence": 0.023230006791991015 } ]

{ "name": "abstract_", "score": 0.00390625 }, { "name": "others_", "score": 0.0078125 }, { "name": "outdoor_", "score": 0.015625 }
Google US 2016 Google Cloud Platform Google Cloud Vision API SaaS REST   N/A           1,000API/M $2.50/1,000API
(1,001-1Mil)
Google Comput Cloud Vision API
"labelAnnotations": [ { "mid": "/m/07bxq", "description": "tourism", "score": 0.67973822 },
{ "mid": "/m/02rfdq", "description": "interior design", "score": 0.56287867 } ]
Clarifai US 2013 Clarifai SaaS REST   N/A                       5,000API/M Sub $19/M
20,000API/M
Clarifai Predicted Tags:
furniture, people, indoors, group, room, adult, woman, seat, man, table, commerce, chair, music, interior, design, business, exhibition
CloudSight US 2014 CloudSight SaaS REST   N/A                       Sub $49/M
800API/M
CloudSight
"name": "メンズ黒のフォーマルスーツ"
Image Vision Labs US 2009 ImageVision SaaS REST   N/A         100API/D Sub $29/M
250API/D
Image Vision Labs
No demo available
Imagga BG 2008 Imaaga Image Recognition API SaaS REST N/A                   Sub $14/M
12,000API/M
2API/S
Imagga
No demo available
ClevAPI RU 2015 ClevAPI SaaS REST   N/A                       1,000API/M Sub $15/M
10,000API/M
ClevAPI
"tags": ["indoors", "furniture", "people"]
NTT DoCoMo JP 2013 docomo Developer support 画像認識 SaaS REST             2,000API/M 商用不可 画像認識
No demo available
Google US 2015 TensorFlow On Premis C++/Python TensorFlow "I tensorflow/examples/label_image/main.cc:207] jigsaw puzzle (963): 0.45199
I tensorflow/examples/label_image/main.cc:207] toyshop (711): 0.049473
I tensorflow/examples/label_image/main.cc:207] gondola (236): 0.0354427
I tensorflow/examples/label_image/main.cc:207] restaurant (694): 0.0302614
I tensorflow/examples/label_image/main.cc:207] prison (702): 0.0236405"

△・・・プログラム次第で何でも実現できるため