マイコミジャーナル

知りたい!を刺激する総合専門サイト


  1. 経営

  2. 経営戦略
  3. レポート

【レポート】

生きている日本語を使いたい - グーグルが日本語IMEを開発したそのワケは

2009/12/09

大河原克行

    グーグル シニアエンジニアリングマネージャ 及川卓也氏

    グーグルが、12月3日に日本語インプットメソッド(IME)「Google日本語入力 ベータ版」を公開した。「我々の予想を越えるほど多くの人に利用していただき、サポートスタッフがこんなに活況なのは久しぶりのこと」(グーグル シニアエンジニアリングマネージャの及川卓也氏)という反響ぶりだ。

    開発コンセプトは「思いどおりの日本語入力」。そして「空気のような存在」を目指したという、この「Google日本語入力」は、就業時間の20%を自由なことに使えるグーグル独自の社内制度である「20%プロジェクト」を活用して開発をスタート。「グーグルならではの日本語インプットメソッドが完成した」と胸を張る。

    グーグルならではという言葉には、グーグル独自の分散並列計算システム「MapReduce」を活用し、膨大なWebの情報から辞書を自動的に生成。世の中に登場したばかりの新語や、芸能人の名前、Webでよく利用される略語などを的確に変換できる点や、統計ベースエンジンによる統計的自然言語処理を採用し、Webをもとにした単語のランキング情報をデータベース化して、これを応用。さらに辞書の更新には、「Googleアップデート」を利用することで最新のデータに定期的にアップデートすることができるといった仕組みを指している。ソフトウェアエンジニアの工藤拓氏は「グーグルが持つ数々の技術を活用することで実現した日本語インプットメソッド」と位置づける。

    Google 日本語入力でグーグルが目指すのは「思い通りの日本語入力」

    開発は工藤氏と小松氏の20%プロジェクトでスタート。ウェブのありままを反映したエンジンと位置づける

    前の言葉を受けて続く単語を判断する

    Webでよく利用されている新語や略語も一発で変化できる

    「2008」と入力すると、去年という変換も可能になる特殊変換機能

    日付では月曜日という変換もできる

    「1989」と入力すると「平成元年」や「昭和64年」という元号の変換も

    さらに数字は16進法や2進法でも表記

    「徳川」と入力すると92個の候補。徳川家の歴代将軍の名前が候補に出る

    「二酸化……なんだっけなぁ」という場合にも、「二酸化」と入力すれば、さまざまな候補が出る

    サジェスト機能はプロパティからオン/オフの操作が可能

    入力履歴機能によって、「こんご」と入力すれば、「今後とも宜しくお願いします」と、自分にとっての定型分で変換する

    グーグル ソフトウェアエンジニア 小松弘幸氏

    ではなぜグーグルが、日本語インプットメソッドを開発しなくてはならなかったのか。

    Google日本語入力の開発に携わったソフトウェアエンジニアの小松弘幸氏は、「グーグル検索の『もしかして』に表示されるスペルミスの多くが、IMEの誤変換によるもの。とくに芸能人の名前や、新語に対して、誤変換が多い。グーグルが日本語入力を作ればうまくいくのではないかと考えた」と語る。

    「もしかして」というのは、グーグルの検索において、検索したい言葉を誤った形で入力しても、グーグル側がそれを推測して、可能性のある言葉を表示するというものだ。工藤氏自らも、Google日本語入力の開発を担当する前は、「もしかして」機能を担当していた経験があり、「もしかして」のシステムが、高い精度で誤変換を修正する様子から、クーグルならではの日本語インプットメソッドの可能性を確信したという。

    及川氏も、「グーグルのサーチにユーザーが入力した単語に誤変換が多かったこと、ユーザーからグーグルに日本語インプットメソッドを開発してほしいという声があったことなどが理由。いまのIMEに対する不満ということではなく、グーグルならばどういう作り方をするのか、どう変えられるのかといったことへの挑戦」とコメントするとともに、「今後も、他のIMEにはこんな機能があるのに、我々のIMEにはその機能がないから追加するというのではなく、グーグル社内に日本語入力のために必要とされるものは、どんなものなのかという指標をおき、その到達度によって、ベータ版から正式版へと移行するといった改良を加えていきたい」とも語る。

    今後は早いタイミングでベータ版から正式版へと移行させたいとする一方、64ビット対応は近日中に対応するとした

    グーグル ソフトウェアエンジニア 工藤拓氏

    「Google日本語入力 ベータ版では、変換した際に、日本語の誤用が多いという指摘もあるが、果たして日本語の誤用といったものがどういうものを指すのかといった判断基準も、まだ我々のなかにはない。ユーザーからのフィードバックを得ながらそういった点も作り上げていきたい」とする。

    Google日本語入力では、「生きている日本語を使いたい」とする。そのための仕掛けづくりが、ユーザーを巻き込みながら始まったというわけだ。

    現在、Google日本語入力 ベータ版を利用できるのは、Windows 7、Windows Vista SP1以降、Windows XP SP2以降、そして、Mac OS XではLoepardおよびSnow Leopardのインテルマック上での動作となる。

    Linuxへの対応や、携帯電話などのモバイル版への対応は計画にはないとする一方、Windowsの64ビット版は、「提供直前で事情があって断念したが、予想通り多くの方々の反応があるため、近日中に対応する」とコメント。また、Mac版においても、現時点では64ビット版のインストールの際に、32ビットのMac OSからブートする必要があるなどの不具合を早期に修正するとした。

    そして、来年にも投入が予定されているグーグルの「Chrome OS」への対応は図られることになる。そのときに、ユーザー情報の提供を必要とするクラウド型のChrome OSに対して、ローカルで利用し、日本語入力した文書や単語がそのままグーグルに送信されることはなく、ユーザー情報も基本的には収集しないとするGoogle 日本語入力とのバランスをどうとるのかも注目されるところだ。

    いずれにしろ、無償で提供されるGoogle 日本語入力の登場は、日本のユーザーにとってITを活用する際に不可欠となる日本語インプットメソッドの領域に新たな風を吹き込んだのは事実だ。この影響が、既存のIMEベンダだけでなく、業界全体を巻き込んだ突風になる可能性もありそうだ。

    Google 日本語入力は非英語圏におけるウェブアプリケーションに必要なコンポーネントとする

    プライバシーに関しての考え方。日本語入力した文書や単語がそのままグーグルに送信されることはないとする

    関連サイト


    特別企画


    注目サイト