機械学習を使って不適切な画像をフィルタリングするシステム NTTコムウェアから

By: Samantha Marx

ごきげんよう

ネット上には様々なコンテンツが溢れていますよね。
健全なものからそうじゃないものまで。文字情報から画像や動画まで。
文字情報については既に健全じゃない対象をフィルタリングする技術は出ています。
しかし、画像や動画についてはこれまで検知を人に頼っている部分があり、上手く進んでいませんでした。

By: Samantha Marx

そんな中、NTTコムウェアが不適切なコンテンツを高精度に識別するシステムの開発し、トライアルを行うとの情報が出てきました。
このシステムでは機械学習技術「Deep Learning」を用いています。
こいつは凄く簡単に言うと下記のようになもの。

1.人間の手を加えていないデータを大量に与えてみた
2.そこから特徴的な情報を機械的に抽出してみた
3.抽出した情報を元に学習してみた
4.そしたら他の画像の中から似たものを探しだすことが出来ました。

みたいな。
Googleがこの技術を使って猫を認識できるようにしてたのは前にニュースになってました。

今回は昨今の日本の現状を鑑みて、アダルトやバカッター炎上コンテンツに対してのシステムかなと思います。
また、「Deep Learning」では学習に100万枚ほどデータを用いるのですが、このシステムでは100分の1の1万枚程度で精度の高いシステムに出来るそうです。特許出願済だとか。
これ、内部的に1万枚を100万枚に増幅させているんじゃないかと思えたり。バリエーションを増やすとか。
もしくは、特徴抽出の部分でもっと特徴を把握しやすいアルゴリズムでもあるのか。
気になる所です。

これだと、動画共有サイトとかで、不適切なサムネイルの動画を把握する事は出来そうです。
あとはSNS上で共有された画像が適切か不適切かをとりあえず判定するとか。

また、ここから先に進めば動画も画像の連続なので、アダルトな描写があるかを先に確認しておけるかも。
どちらにせよマシンパワーが必要なのである意味、人間のマンパワーから機械のマシンパワーに移行しようとしているのかもしれません。

今後のこの業界の動きが気になります。

それでは ごきげんよう

source:
NTTコムウェア | 不適切コンテンツの自動フィルタリングシステムのトライアルを開始-DeepLearning技術を活用して人間の感性に近い判定が可能に-

http://www.nttcom.co.jp/news/pr15020901.html

RSS/feedlyはこちら

follow us in feedly


にほんブログ村読者登録はこちら

あすへん! 〜薙月の明日への変化〜 - にほんブログ村

Twitterアカウントはこちら