日本語形態素解析をしなくてはならない

と、何とも難しそうな単語を出してみたのですが、仕事でそんなことをやらないといけなくなりました。

形態素解析の詳しい説明はWikipediaなどに掲載されていると思いますが、簡単に言うと入力された日本語を品詞別に分割する行為のことです。

と言っても僕がするのは、既にオープンソースで作成されている形態素解析のソフトウェアを使って、そのアウトプットを会社のシステムで汎用的に利用できるようにAPIとして(しかも最近流行のRESTfulな)提供するというものなのですが・・・


皆さんご存知でしょうか? Google MailやHotmailYahoo! Mailといった無料のメールサービスを利用すると、ブラウザでメールをチェックした時に広告が表示されると思うのですが、実はあの広告は、メールの内容を形態素解析を利用して「名詞」を抽出し、その「名詞」に最適な広告が画面上に表示されるようになっています。 例えば、友達からバーベキューのお誘いメールがあった場合、バーベキュー用品とかアウトドア車の広告が表示されるのです。 うすうす皆さんも気付いていたとは思いますが(笑)