Mozc

読み方 : もずく

英語正式表記 : Mozc

Mozcとは

Windows/Mac対応のかな漢字変換ソフト「Google 日本語入力」のオープンソース版ソフト。グーグルが2010年5月に公開した。ライセンスはBSD。独自の変換ロジックや、書き出しで変換候補を自動表示するサジェスト機能などに特徴がある。

従来のLinux対応かな漢字変換エンジンの代表格は「Anthy」である。Mozcのかな漢字変換エンジンとしての基本的な仕組みは、Anthyなどとそれほど変わらない。つまり、文法や辞書に基づいて、入力された文章を、意味が通じる最小の単位にまで分割する。その上で品詞などを判別し、最適な文字列に変換する。

だがMozcは文字列に変換する際に、グーグル得意のWeb検索で培った技術を基にした独自のロジックを利用している。具体的には文法知識や文字の登場頻度だけでなく、膨大なWeb検索結果から得られた統計データを基に、変換している。

また、文字入力を支援するための「サジェスト機能」も充実している。携帯電話のような予測変換機能を備え、先頭から数文字入れただけで自動的に変換候補をいくつか表示する。変換キーを押さなくても、一文字入れるたびに候補が絞り込まれていく。そのほか「お世話になります」のように使用頻度が高い長文も記憶し、変換候補に表示する機能もある。

Mozcをインストールするにはソースコードからビルドする必要があったが、ここにきて国内向けディストリビューションに“標準搭載”されるケースが出てきている。例えば、日本で運営している「Momonga Project」が2010年9月13日にリリースしたLinuxディストリビューション「Momonga Linux 7」は、前バージョンまでのAnthyに代えてMozcを標準のかな漢字変換エンジンに採用している。また、日本のコミュニティ「Ubuntu Japanese Team」が2010年10月16日にリリースした「Ubuntu 10.10 Desktop 日本語 Remix CD」でも、「日本語環境セットアップ・ヘルパ」を利用して手軽にMozcをインストールできるようになっている。

出典:ITpro「今日のキーワード」(C)日経BP社

[2010年10月31日 公開]

大塚商会の法人向け通販サイト(たのめーる)のご紹介