自然言語処理

 

自然言語処理 (放送大学教材)

自然言語処理 (放送大学教材)

 

 

 最近、人間が話す言葉をコンピュータはどうやって認識するのだろうという部分に関心を抱きました。そしてそのあたりの銘柄を発掘していたりしていたのですが、活用はされ始めているが儲からんという感じのことが書かれていたりしました。しかし、うちの母親なんかはもはや携帯でも音声入力を使っていたりして、しかもその精度はかなり高く、メールのやり取りでもあまり間違いはないようです。

 

 そこで、このようなことを支える技術は何なんだろうということで調べていると、自然言語処理という言葉が出てきたので、まずは入門用にいいと書かれたこの本を手に取ってみました。まず、自然言語ってのが何かということですが、自然発生した言語ということで我々ヒトが話す言葉のことを指します。その反対はコンピュータに入力するようなプログラミング言語です。

 

 ご存知のように、自然言語は地理や文化なんかによって全然違う形式をとっているため、どういう風になっているのか難しい。最初は米国がロシアに抜かれたことが悔しくてロシアのことを調べようと、ロシア語を英語に翻訳するというのが試みられたそうだが、結局、規則がランダムすぎて、言語の研究をもっとしようと挫折したらしい。で、なんか言葉の研究やらなんやらかんやらがあって今に至るという感じのようだ。

 

 で、コンピュータがこのブログに書いていることや、ネット記事を理解しているかってところですが、まぁ、できてるのかもしれないなぁor今後できるかもしれないなぁという感じでした。これは一年前の本なので、まぁ、今頃はできているのかもしれませんね。あと、2011年にクイズ大会に勝ったワトソン君ですが、なんと、問題を聞いて解いていたわけでなく、彼だけテキストメッセージが与えられていたようです。

 

 というわけで、難しいけど面白そうな分野だということがわかりました。この本の難点はラジオの授業用ということで、専門用語もしくは難しい用語が全然解説されていないことです。でも、分からないからと調べるとひどく長い文章が出てきたりするので、それはそれで大変だったりします。そのため、もう一冊入門書を購入し、少しでも謎が解けるようにと読んでいこうと思います。でも、音声をテキスト化するってのはグーグルやシリを見ていると不可能ってことではなく、それの分析、活用に取り組むってのは、この分野であるので、面白いかなぁというのは実感できます。

 

自然言語処理の基本と技術 (仕組みが見えるゼロからわかる)

自然言語処理の基本と技術 (仕組みが見えるゼロからわかる)

 

 

 この辺を調べているのは自分が活用したいことがあるというのと、投資用です。僕は人工知能が最初に活用できる分野はここなんだろうなって気がしていまして、その辺に投資を始めています。まぁ、この分野での活用は失敗しても命を落とすわけではなさそうだし、それなりに色々な技術が必要だし、電話くらいにしかデータがない会社も多そうで、ビッグデータを売り込む際にこれがあれば一石二鳥みたいに感じられますものね。でも、6月英国の国民投票を前に調整もありそうなので、少しずつ買っている感じです。僕が投資を再開したということがなんかのフラグにならなければよいですが。