機械学習を使って不適切な画像をフィルタリングするシステム NTTコムウェアから

By: Samantha Marx

今日の人気記事

  1. SMART ICOCAを発行して使ってみたので良い点悪い点をまとめてみた
  2. 京都祇園にはちょっと変わったLAWSONがある ローソン 八坂神社前店
  3. SMART ICOCAの退会(払いもどし)をしてみたので注意すべきことをまとめておく
  4. BIC SIMカウンターでSIMカードをmicro SIMからnano SIMへサイズ変更してみたので残しておく
  5. 円錐形ドリッパーを買ってみたので台形(扇形)ドリッパーとの違いをまとめてみた
  6. イオンゴールドカードのインビテーション到着からカード受領までをまとめてみた
  7. マウスからトラックボール(親指型/人差し指型)に変えて感じたメリットとデメリット
  8. LinuxでGoogleドライブを使えるようにしてみたのでメモ残しておく
  9. GALAXY Note II(SC-02E)をAndroid KitKat (4.4.4/CM11)にしてみたのでメモ残しとく
  10. UFOキャッチャーを使って計1,000円程度でぬいぐるみを4つ取ったので注目すべき点をまとめておく
この記事の読了時間: 220

ごきげんよう

ネット上には様々なコンテンツが溢れていますよね。
健全なものからそうじゃないものまで。文字情報から画像や動画まで。
文字情報については既に健全じゃない対象をフィルタリングする技術は出ています。
しかし、画像や動画についてはこれまで検知を人に頼っている部分があり、上手く進んでいませんでした。

By: Samantha Marx

そんな中、NTTコムウェアが不適切なコンテンツを高精度に識別するシステムの開発し、トライアルを行うとの情報が出てきました。
このシステムでは機械学習技術「Deep Learning」を用いています。
こいつは凄く簡単に言うと下記のようになもの。

1.人間の手を加えていないデータを大量に与えてみた
2.そこから特徴的な情報を機械的に抽出してみた
3.抽出した情報を元に学習してみた
4.そしたら他の画像の中から似たものを探しだすことが出来ました。

みたいな。
Googleがこの技術を使って猫を認識できるようにしてたのは前にニュースになってました。

今回は昨今の日本の現状を鑑みて、アダルトやバカッター炎上コンテンツに対してのシステムかなと思います。
また、「Deep Learning」では学習に100万枚ほどデータを用いるのですが、このシステムでは100分の1の1万枚程度で精度の高いシステムに出来るそうです。特許出願済だとか。
これ、内部的に1万枚を100万枚に増幅させているんじゃないかと思えたり。バリエーションを増やすとか。
もしくは、特徴抽出の部分でもっと特徴を把握しやすいアルゴリズムでもあるのか。
気になる所です。

これだと、動画共有サイトとかで、不適切なサムネイルの動画を把握する事は出来そうです。
あとはSNS上で共有された画像が適切か不適切かをとりあえず判定するとか。

また、ここから先に進めば動画も画像の連続なので、アダルトな描写があるかを先に確認しておけるかも。
どちらにせよマシンパワーが必要なのである意味、人間のマンパワーから機械のマシンパワーに移行しようとしているのかもしれません。

今後のこの業界の動きが気になります。

それでは ごきげんよう

source:
NTTコムウェア | 不適切コンテンツの自動フィルタリングシステムのトライアルを開始-DeepLearning技術を活用して人間の感性に近い判定が可能に-

http://www.nttcom.co.jp/news/pr15020901.html

RSS/feedlyはこちら

follow us in feedly


プッシュ通知受信はこちら



Twitterアカウントはこちら



コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

Time limit is exhausted. Please reload CAPTCHA.

次のHTML タグと属性が使えます: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>