Google IME(Google日本語入力)
顔文字辞書(^・^) 医学用語辞書 カタカナ英語辞書
〜医学用語辞書(2009/12/19作成済み)カタカナ英語辞書も作成予定(2009/12/22)〜
→ワキガ(腋窩臭)加齢臭など体臭で気になる臭いを消臭!解消!!
12月3日、Googleが『Google日本語入力』をβ版ながらに公開した。
私が知ったのは、翌々日辺り…。
Webから自動で辞書を生成。強力なサジェスト機能を備えているとの事。
さらに、新語や専門用語、芸能人名なども網羅しているらしい。
Web上の膨大なのデータから統計的言語モデルとやらをを構築し、
変換エンジンを構成。
そして、変換精度を高効率化した模様。
※Windows XP/Vista/7(各々32bit版)とMacに対応。
※導入時のファイルサイズは約55MB(Windows XPの場合)。
機能面としては、
入力途中の文字から単語を予測する予測変換機能も搭載されている。
又、日本語モードのまま「hっtp:・・」と入力すると「http://」に自動的に変換されるなど、
URL入力もし易い様に工夫されている。
■メリット:サジェスト機能とは■
→冒頭の数文字を入力すると候補語を提示する機能をいう。
ここ数年、検索エンジン(GoogleをはじめYahooなど)でも検索語(キーワード)を入力すると
いくつか下部に候補語が提示されるのと近似と考えてよいだろう。
Googleという事もあり、早速インストールした。
(もちろん、検索して多少のレビュー確認後に)
インストール方法・設定方法等は、検索すれば即Hitするだろう。
【使用所感】
さすがに、デキはいい!!
1文字でも入力すればサジェスト機能によって、デフォルトでは3候補の単語(言葉)が
下部にリストアップされる。
さらに、2文字目も入力するとまた異なった3候補が瞬時に表示される。
さらに、3文字目も入力すると………。
と言った感じだ。
タイピングに慣れている方、ブラインドタッチが容易にできる方は、
少しウザく感じる時もあるかもしれない。
だが、慣れてくると新語やネット用語、人名等々は確実に入力し易く速い。
ブラインドタッチをされる方は、キーボードを殆ど見ないので、
ある意味、サジェスト機能を閲覧しながら思わず、苦笑する事もあるのではないか…。
(ただ、前述した様にそれ自体が初めのうちは少し目障りに感じても…。)
と言ったところだろうか。
そこで、
MS-IMEには、最初からいくつかの顔文字辞書が(dic)として用意されている。
この事を知らずに使用している方もいるだろうが設定次第で簡単に顔文字が変換される。
私用では、かく言う私もその恩恵を受ける事も多々ある(あった)。
だが、Google IME(Google日本語入力)には、顔文字辞書がない。
上記同様に、郵便番号から住所への変換もできない。
zipcode.dicなるものがない。
これは、不便極まりない。
自分で作成…。
だが、その前に検索してみた。
結果、見事に一発hitした。
それが以下URL。
→郵便番号辞
書(for Google 日本語入力)ダウンロード with 根性
心底ありがたい。
『郵便番号辞書』は、解決したが
タイトル通りの『顔文字辞書』がない。
検索すれば、
MS-IME用とかATOK用とかことえり用とかはある。
そこで、作成してみた。
→【Google IME顔文字辞書(UTF-8)】(3file:約21223個)
Google IMEの辞書登録の品詞には、「顔文字」がない為「名詞」で作成。
※数が多いので、DLされたら、お好みでよろしくお願いします。
適宜、数をへちゃすけれど…。
辞書登録方法も記載の必要はないと思ったが、
流れのみを以下に文字記載。
■辞書登録方法■
レンチアイコンをクリックして辞書登録をクリックすると、
辞書登録ダイアログが表示される。
このダイアログで手動で辞書への追加が出来る。
辞書ファイルのインポート機能がある。
【管理→新規辞書のインポート】
にて、該当ファイルを選択しインポート。
注)気をつけて頂きたいのですが、おそらく(重い)フリーズっぽくなります。
………しばらくすると、インポート完了………。
この作業を登録したいファイルの数だけ実施。
■欠点■
※変換確定後に再変換が出来ない...。
早急に改善して欲しいと思うのは、私だけでしょか。
そして、ワンフレーズにて変換中に文節の区切りがおかしい事が多々(許せる範囲だが)ある。
※次に、Google IMEのウリであるサジェストに出てくる候補語。
サジェストはネットに氾濫している言葉を候補として表示する。
とされている。
よって、時にビジネス文書や畏まった(もしくは、正しい)文章を書く時に違和感を感じる。
※※【重要】※※
GoogleIME(Google日本語入力)は、
ある意味でタイピング量が減るので便利だが、
間違った候補を選択する恐れもある。
その一例として以下に記載。
ex)
「まとを」と入力すると…。
的を得
的を得た
的を射る
がサジェストされる。
「まとを」で正しいのは「的を射る」だが、
表示の優先順位は誤字である「的を得」となっている。
誤った読み書きに対する処理は、現時点ではATOKの方が賢い。
誤った使い方を体とする2ちゃんねる等に限定して使うと
GoogleIMEは真価を発揮するとも言えるのではないか。
GoogleIMEとATOKの電子辞典が連携出来れば誤変換対策は完璧になるので、
GoogleとATOK(ジャストシステム)は検討してはくれないだろうか。
★最後に所感及び危惧★
『履歴というprivacy』
昔は、愛用の万年筆を人に貸すのはよくないと言われていた。万年筆のペン先は柔らかいので、人に使わせると、すぐにクセがついてしまい、自分が使いにく
くなってしまうかららしい。
現在に於、万年筆をボールペンやシャープペンシルの用に使用している人は少ないだろうが、その代わりに、多くのデバイスで稼働している日本語入力システム
である。
携帯電話では予測変換、WindowsのIMEでも、ATOKなどの連想変換、省入力、推測変換などは使いようによってはとても便利である。
例えば、時間がない時やラッシュ時の電車内で立ってメールを書いている時などは、これらの機能の恩恵を受けている。片手でPCを支え、反対の手の数本の
指先で入力をする為、両手でタイピングする時とは異なり効率は格段に低下する。しかし、予測変換によって、多少のスピードアップにはなる。
「Google日本語入力」には、サジェスト機能が実装され、履歴などから幾つか(デフォルトでは3つ)候補語が挙げられる。
数文字入力すると自動的に候補が表示され、Tabキーを使い強制的に予測させることも可能。その候補語を見て思わず苦笑する事があるのは、デジャブ的な
単語やフレーズがあるからと考えられる。多くの人がこの候補語を採用する様になったら、世の中の文章は、画一化されてしまっているかもしれない。
文章を「である調」で書こうと思っても、「です、ます調」の候補語だとしたら、ついついそれを選んでしまうのが人間心理ではないだろうか。
TPOにもよるが、「だいじ」まで入力し候補語に「大丈夫だよ」と出れば、「大丈夫です」と書くつもりだったはずが、ついつい目の前に表示されている候
補語を選ぶだろう。もしかしたら「きぼう」が「キボンヌ」、「ごめん」が「ゴメソ」と候補語によって変換確定してしまう事も無きにしもあらず。
インターネット上の膨大に蓄積された文章から、見事ななアルゴリズムで分析し、膨大なコンピュータリソースをつぎ込み、計算で作り上げた辞書である。そ
の様な過程で作成された辞書は、確かに便利だと思う。
しかし、前述した様な事の他にも様々な問題を人間自身が自らに突きつけるのかもしれない。
予測変換が的確な機能を果たす為に重要な素因は、変換確定履歴である。過去に、ユーザーが入力し、変換確定した結果がうまく反映されれば、その候補語は
より優れたものになる。
だから、IMEは万年筆やシャープペンシル等と同様、他の人が使うと、IMEがトルネード的な学習をして、変換候補にハムが混在する様になってしまう。
これは、ペン先に別の人のクセがつくのと同様。車のクセもまた同様と言えるかもしれない。それと、過去にどんな文章を書いたのか人間の頭脳で予測的心理が
働いてしまう為、プライバシーも考える必要性があると考えられる。
Google
IMEのサジェスト機能は、初めて使用するユーザーにとっても、新鮮な感覚はないのではないか。既に不特定多数の誰かが、使用した車のクセ的なものがある
様に感じるかもしれない。だが、それがインターネット。インターネットの先駆者の叡智の集大成なのだから。
前述した様に、その辞書を使うと、この様な文面は自分では書かないと思う文面になってしまったりもするだろう。もちろん、Google
IMEの候補を無視しながら、地道に変換すればいいが、影響を受けない人間はいない。極論的だが、「くるま」と入力しただけで、インターネット上から車関
連文章を探し出し、それとなく候補に挙げるようになるかもしれない。検索エンジンににキーワードを入力し、検索するのは、このインターネット時代、当たり
前に行われているが、それと近似なものが、変換キーを押下する度に行なわれるようになったらどうだろう。少し考えさせられるのではないだろうか。
おそらく、Googleは、その様な事はしないだろう。しかし、その気になれば、いつでもできるという叡智の上の警鐘になのかもしれない。
取り急ぎ、
顔文字辞書up。
今後は、
サブタイトルの辞書も作成し、出来次第公開予定。
再度、取り急ぎ医学用語辞書up
→【Google IME用医学用語辞書(UTF-8)】(7file:65080語収録)
カタカナ英語辞書を作成してくれた方がいらっしゃいました。
→【Google IME日本語入力用カタカナ英語辞書】
直リンク(直リンクは、上記URL内容をご確認の上ダウンロードして下さい)
→【Google IME日本語入力用カタカナ
英語辞書】
4万6千語では、多すぎると言う方は他にも作成してくれた方がいらしゃいました。
→【Google 日本語入力の辞書ダイルで英語辞書を作ってみた】
直リンク
→【Google 日本語入力の辞書ファイルで英語辞書を作ってみた】
私は、
『google-ime-user-dictionary-ja-en
カタカナ語から英字に変換する、Google日本語入力のユーザー辞書作成プロジェクトです。(EDICT使用)』
を利用させて頂きました。
→ワキガ(腋窩臭)加齢臭など体臭で気になる臭いを消臭!解消!!