人工知能は人間を超えるか_ディープラーニングの先にあるもの

 人工知能開発の発展は人間社会にどのような影響を与えるのか。人間の知的機能を機械で再現する手法の歴史を振り返りながら、第5章では特徴表現学習においてブレークスルーを果たしたディープラーニングに注目。今後の展望と人間社会(産業・軍事など)への影響を考察している。
 知能という複雑なものを相手にしている人がわざわざ素人むけに書いているのは、わたしたちのような一般の人にも、人工知能と人間との関係について一考してほしいという願いがあるのだろう。
 出版は2015年。背景はやはり、特徴表現学習においてブレークスルーが起きたこと(著者は50年来のブレークスルーだとしている)。2020年の現在は、AIという言葉が流行し、自動運転技術の開発、チャットボットによる旅行コンサル(JAL)、音声認識APIの開発や提供なども進んでいる。ブレークスルーが起きたという現象が投資家の目に留まり、人工知能ブームがくるぞ(この種は大きく育つぞ)という期待の高まりを生んでいるように思う。より便利な生活が送れるようになるとか、未解決であった問題が解決の方向に向かうかというよりも、「果実がたっぷり実るか」というモノサシが優先されているような虚しさも否めない(ま、半分くらい妄想かもしれないけれど)。
 著者の松尾豊氏は、1993年に香川県の丸亀高校を卒業したのち東京大学工学部電子情報工学科に進学している。1997年に同科を卒業すると大学院に進学、工学系研究科電子情報工学の博士課程を2002年に修了した。同年には『語の共起の統計情報に基づく文書からのキーワード抽出アルゴリズム』という論文を発表(東京大学工学系研究科、石塚満氏と共著)し、人工知能学会論文賞を受賞している。同論文のまえがきには”単一の文書だけから手軽に、比較的高い精度でキーワードを取り出すことができるのが大きな特徴である”とある。 文書の概要を知りたい場合に、頻繁に登場する語と併せて登場している語(共起語)の共起確率を解析することで、文書中のキーワードを抽出できるという理屈だ。こちらは画像認識や音声認識の研究というよりは統計的な処理によって文書検索を効率化するアルゴリズム開発にあたる(自然言語処理、と呼ばれる分野だと思われる)。
 その後は2005年にスタンフォード大学 CSLIの客員教授を務めたり、2017年には日本ディープラーニング協会の理事長に就任したりするなどをして人工知能研究の第一人者となった。詳しい業務内容はわからない(私の勉強不足で想像が難しい)のだが、人工知能研究の主眼は「人間の知能をいかにして記述するか」にあるため、その研究に邁進されていたのだと想像する。
 2012年の、画像認識のコンペティション「ILSVARC(Imagenet Large Scale Visual Recognition Challenge)」で、トロント大学(初参加)の開発したSuperVisionが圧勝したことがディープラーニングへの注目をグンと高めた。特徴表現学習の精度が、2位のチームよりも10ポイント以上も高かったためだ。それまでは特徴量の設計は人間の肌感覚(長年の知識と経験に基づく職人技)によって行われており、1年かけて1%の改善が起こるか否かというレベルだった。ディープラーニングは、質のいい特徴量を自ら発見する手法として脚光を浴びている。つまり頑健性の高い特徴量を、人の手によらず発見できる手法だ。その精度が示されたのが、ILSVARCというコンペティションだった。特徴量の獲得は概念の獲得と似ており(人間→哺乳類→動物→生物という風に概念の関係を理解し遷移できる)、特徴量を自ら獲得できるということは、情報を「理解する」ことに近い。とはいえその特徴量は人間が与えるではなく、機械自身が獲得するゆえに、人間とは異なる体系が作られていく可能性もある。”機械知能”とでもいえばいいだろうか。
 ”特徴表現”という概念について、自分なりの解釈もまとめておきたい。特徴表現というのは、質的なものを量的なものに変換する際のモノサシ、という風に解釈している。人間がパッと一瞬で判別できることを、機械はできない。たとえば乗り物でいえば、コレは車、アレは電車、ソレは飛行機、といった区別をするのに、いちいち量的な値(つまり数値)に変換する必要がある。正面からみた写真と横から見た写真では全く異なる数値になるはずだが、それでも同じものであると判断しなければ不正解となる。同じものを同じと判断し、違うものは違うと判断する、この一貫性を精度高く保つモノサシが「特徴量」と呼ばれるものだと捉えている。これまでは人間の側が知識と経験に基づいて職人芸的に設定していたが、ディープラーニングの登場によってその役割を機械が代替できるようになった。機械が、異なる数値に”同じ”を見られるようになった。画像認識や音声認識で行われているのは、特徴表現学習というもの。データに見られる特徴的なパターンや区分け(文章中の単語群から文書のカテゴリ分類をしたり、画像から人・動物・建物と理解したり、楽器だとか人の声だとかを認識したり)の鍵となる「特徴量」を獲得する学習。「ワケル」と「ワカル」が学習の基礎(認知の基本動作)になるのだなと再認識した。 
 松尾豊氏の願いに応じるとするならば、人工知能と人間とのつき合い方について、一考することがいち読者としてふさわしい対応だ。専門家が平易な言葉でわざわざ執筆してくださっている。
 以下、非常に短く内容も浅いものではあるが、私なりに考えたことを記録しておきたい。本書で強調されている内容は、機械が自ら特徴量を獲得できるように成った、つまり量化すべきモノサシを自ら獲得できるようになったこと。個人的には、この事実は「モノサシは如何用にも生み出せる」ことを示唆していると思っている。機械が自ら特徴量の設計をする行為は、情報を区別する(概念を獲得する)ときに、量化(コンピュータが取り扱い可能な状態に)するべき指標を自ら設定することになる。大雑把にいえば、モノサシを自分で作っている。これは、株価向上の追求や個人の幸福の追求こそが善とみなす現代社会に対して「もっと自由でいい」と投げかけているようにも思える。多様性の時代といいながら、その実、価値基準はどんどん単一化されていっている。株価、売上、ページランク、フォロワー数、チャンネル登録数、わかりやすい指標によってしか価値を判断ができず、多くの人々が思考停止状態に陥っている。この流れが加速すれば人間は、機械よりも不自由になっていく。自由な人工知能/不自由な自然知能のできあがりだ。もはや機械のほうがうんと自由度が高い。浅く・薄く・短く・小さくなっていく人類に、自由度を持たせてくれる唯一の希望が人工知能なのかもしれない。

参考文献|
人工知能は人間を超えるか ディープラーニングの先にあるもの(松尾豊)
語の共起の統計情報に基づく文書からのキーワード抽出アルゴリズム

ABOUTこの記事をかいた人

編集者。メディアづくり・チームづくり・コーチング(編集の)が得意。生きづらさを市場化すべく試行錯誤中。薬を飲むの苦手、手数の多い単純作業苦手、声の大きい人苦手、飲み会苦手。根性叩き直し中。目標はリオネル・滅私。