幸せになり隊

幸せってなに?どうやったら幸せになれるの?そんな思いを密かに燃えたぎらせる人たちの試行錯誤の記録。

新しいreCAPTCHAの意味

12月3日にGooglereCAPTCHAに新しい技術を採用することを発表しました。

 

reCAPTCHAとは「ゆがんだ文字」を人に入力させて人間とボットを判別する技術のことで、以下のようなものを見たことがある方も多いと思います。

f:id:wbhappy:20141208234253p:plain

これ2つの単語を入力するようになっていますが、片方は「判別用」でもう片方は「学習用」に使われるようになっているのをご存知ですか?

 

学習とは「機械学習」のこと。簡単に言うと「人工知能」です。

 

機械に↑の画像のようなゆがんだ文字を正しく認識するための学習をさせようとする場合、この「ゆがんだ文字」に対する正しい答えが必要になります。これは人間が教えるしかないのですが、それを少人数でコツコツ入力するのは大変ですよね。

そこでインターネットを利用している大量のユーザに任せてしまおうというクラウドソーシング的な考えから、「判別用」の答えだけじゃなくて「学習用」の答えもユーザに入力させるようになっています。

知らず知らずのうちに協力していたわけですね。どんどん機械が賢くなりました。

 

その結果(かどうかは分かりませんが)、例のようなゆがんだ文字でも突破するボットが出てきてしまったという問題がありました。

 

では新しいreCAPCHAではどうなっているのでしょうか?

 

まず新しいreCAPCHAがどんなものか。Googleの紹介動画があります。 


Introducing the no CAPTCHA reCAPTCHA - YouTube

 

平たく言うと「文字入力が面倒だからワンクリックでできるようにしたよ」ということです。スマホが普及した今、文字入力をしなくていいというのは助かりますね。

 

で、肝心の人間-ボット判別をどうやって実現したかというと「正しい画像を選ばせる」です。

 

↓の画像のように、お題の画像に対して似ている画像をすべて選ばせるというものです。

f:id:wbhappy:20141208233951p:plain

画像認識はかなり高度な技術が必要ですので、確かにこれで人間とボットは判別できそうです。

 

ではこの新しいreCAPTCHAでは何を学習しようとしているのでしょう?
裏の意図があるはずです。

 

「物体認識」なのは間違いなさそうですが、「判別」と「学習」が明確に分かれていないので単純な答えを求めてはいないようです。(「判別」と「学習」を同時にするところが難しそうですが、明らかに間違った選択をしていなければボットと判別しないというルールになってたりするんですかね?) 

 

私は次のような意図があるのでは?と勝手に思っています。

  • すでに学習しているデータの強化(復習)
    犬と猫はよく似ているので、既存データから学習しただけでは同じような分類がなされているかもしれません。ですが、おそらく人の目が入ることで収集したデータには偏りが生じるはずです。それを加味すればより良い学習が可能になりそうです。
  • 間違って選ばれてしまう画像の活用
    既存データで学習した場合にはまったく無関係とされていたのに、人の目からすると同じように判断される場合があるかもしれません。この場合、ボットと判別されるのかもしれませんが、誤選択データとしては偏りが生じそうです。・・・類似度の計算などに使えそう。

 

後者のほうが面白そう・・・。
機械的にはまったく別のものなのに、人の感覚では似ているものってそそられます。

 

ちょっと論点がずれましたが・・・
こういったデータを蓄積していくことで、画像認識(動画認識)を非常に優れた精度で可能にしていこうとしているのでしょう。

 そうすると人が目で見て判断しているような仕事はほとんど自動化されてしまいそうですね。

 

というか、このreCAPCHAの仕組みって音声データとかいろいろな種類のデータでも使えそうですよね。

 

新しいreCAPCHAが出るたびに、それが何を学習しようとしているのか?を疑うことで、現状の人間が作り出せる「機械の認識力」を推し量ることができるのかもしれません。

 

うーん。 機械が人間と同等の認識力を持つのは遠くないのかも・・・。

 

 

ちなみに使い方はコチラのサイトが非常に参考になります。

 

おわり