« 2010年9月 | トップページ | 2010年11月 »

2010年10月

2010年10月30日 (土)

skkにおいて「っ」で送り仮名を開始する問題(tu-problem)

skkにおいて「っ」で送り仮名を開始する問題(tu-problem)

Time-stamp: "Tue Jul 20 14:17:33 JST 2010"

skk-vars.elで定義されるローマ字仮名変換テーブルは skk-rom-kana-base-rule-listにある。 デフォルトのskkで「っ」が割り当てられているローマ字英字列には次があ る。

bb, cc, dd, ff, gg, jj, kk, pp, rr, ss, tt, vv, ww, xx, yy, zzの16個 はもっぱら「nipponn」のような単語の途中に詰まる音「っ」が挟まる場合 に使う。そのため「っ」の後ろに同じ英字がくっつく。例えば「pp」と打つ と「っp」になる。続けて「onn」と打てばよい。ローマ字仮名変換テーブル では「残る文字」として「pp」に対して「p」が設定されている。

その他に「っ」を単独で打つためのxtuとxtsuが用意されている。普通は 「nixtuponn」のような面倒な打ち方はしない。

なお、hhにはローマ字割り付けがない。nnには「ん」を当てる。正統azikで は「q」に「ん」を割り当てる。aeiouの連続二文字はローマ字で使われな い。

「l」はskkにおいてアスキー仮名トグルキーとして使われ、「q」はひらが なカタカナトグルキーとして使われる。どちらもローマ字の第一文字目とし ては使われない。(「l」と「q」をローマ字の第二文字目以降に使うことは 問題ない。skkでは割り当てないがskk-azikではたくさんの割り付けがある)

「mm」には「っm」の割り当てがない。「っ」の次に「まみむめも」のどれ かが来る単語はSKK-JISYO.Lに登録がない。

skkのローマ字仮名変換テーブルに限らず全ての仮名漢字変換プログラム、 たとえばms-imeとかatokそしてskkにおいて、小文字のローマ字と仮名の対 応だけが定義される。大文字のローマ字と仮名を対応させる定義はない。し たがって英大文字を受け取ってもそのローマ字を仮名に変換する際には小文 字に直してからローマ字仮名変換テーブルを検索することになる。

(注)atokのローマ字入力では英字の大小に関係なく仮名に変換される。 shiftキーを使ってもcapslockオンでもそうなる。しかしms-ime 2000のロー マ字入力ではそうなっていない。capslockオフでshift英文字は全角英大文 字、capslockオンでshift英文字は全角英小文字になるようである。

ローマ字入力において例えば「t」を打つと一文字の「t」に対応する仮名は 定義されていないので「t」をそのまま画面に表示してローマ字の二字目の 入力待ちになる。次に「a」が入力されたら「t」の表示から「ta」に割り付 けられた「た」の表示に変わる。

ここで、もし「tay」に対して「てぃ」が割り付けられているとしたら「t」 の次に「ta」になっても機械は人間が「ta」の「た」と「tay」の「てぃ」 のどちらを入力しようとしているのかが判断できない。仕方ないので画面に 「ta」を表示したまま三文字目の入力待ちになる。三字目として「y」を受 け取った時点で「ta」の表示から「tay」に相当する「てぃ」の表示にな る。

ということは「ta」の入力に対して「た」を表示させることは不可能という ことである。ローマ字の英字列を木構造(tree、トリー)で表すとき、中間の 枝分かれ個所に仮名を割り当ててはいけない。仮名は木構造になるローマ字 ツリーの枝の終端にしか配置できない。上記のような割り付けは実際のロー マ字仮名変換テーブルに存在しない(してはいけない)。

t→(ta)→tay(てぃ)
     ↓
    tao(たぉ)

ここまでにskkの特徴が一つ現われている。「ta」と入力したら「た」がす ぐに画面に表示されることである。ms-imeとかatokではそれが生きているか ぎり入力した文字列は未確定状態にある。たいていは文字列にアンダーライ ン(赤色が多い)が入る。エンターキーを押すまでは入力したことにならない 宙ぶらりん状態になる。skkでは仮名入力でもアスキー入力でも確定操作が 要らない。仮名漢字変換をバイパスする直接入力のためにskkを殺す(停止す る)必要はない。

skkのローマ字入力においてローマ字第一字目の英字を大文字で入力するこ とは変換状態(未確定状態)に入ることである。shiftを押しながら「t」すな わち「T」を入力すると画面には▽が前置された「▽t」が表示される。▽は 以後の文字列を未確定状態に置くことを意味する。「t」だけの一文字に相 当する仮名は存在しないので「t」をそのまま表示してローマ字二文字目の 入力待ちになる。次に「a」を打つと「t」の表示から「た」の表示に変わ る。

「▽た」が表示されたところでスペースキーを押すと仮名漢字変換候補の 表示になる。▽が塗り潰された▼に代わり「▼多」などになる。スペース キーを押すごとに次々と候補が表示されてゆく。希望のものでenterか ctrl+jで確定する。「▽た」が表示されたところでqを押すと片仮名の「 カ」になる。もし「▽タ」であったなら「た」になる。

送り仮名のある「立つ」は「TaTu」と入力する。まず「Ta」の入力で「▽ た」の表示となる。次にshiftを押しながらの「t」すなわち「T」で「▽た *t」の表示になる。アスタリスクは送り仮名の入力開始点を意味する。アス タリスクより前が送り元でアスタリスクより後ろが送り仮名になる。そして 送り仮名の第一文字が「t」で初まるということである。「t」に相当する仮 名はないので送り仮名のローマ字二字目の入力待ちになる。次に「u」を受 け取ると送り元が「た」で送り仮名が「つ」の仮名漢字変換候補を辞書から 探す。辞書では「たt」のエントリになる。辞書から見つかった「▼立つ」 などを表示する。スペースを押すことで他の候補「▼建つ」などに移る。希 望のもので確定操作する。

送り仮名に対して送られる側(部分)を一括する呼び名がみつからない。それ では不便なので「送り元」と呼ぶことにする。

裁判に訴えでる人を原告と呼び、訴えられた人を被告という。裁判官に対し て告げ元となる者が原告であり、告げられる(告げ口を被る)ほうが被告にな る。原告・被告は法律用語というより一般用語として使われるので、前置さ れる「原」とか「被」の接頭字の意味を考えることなく全体を一つの単語と して理解する。なお、国語辞書によると「被る」とは「自分の意思に関りな く他から作用を受ける」とある。
これが相続人・被相続人となると「被」の漢字の意味から判断するようにな る。日常的に法律用語として使う法曹関係の人ならともかくその世界から無 縁の人は被相続人と言われてもピンとこない。相続人とは財産(その多くは 遺産)を貰う人をいう。被相続人とは財産を貰うという行為を被る(貰うとい う作用を受けるとは貰われる)人になり財産を呉れる(渡す)人ということに なる。ひらたく言えば子供が相続人でその親は被相続人である。うっかりす るどっちがどっちだか分からなくなる難しい用語である。
私は既に両親を亡くしているので財産を呉れる人はもういない(たぶん)。完 全な被相続人になっている。悲しいかな我が家でこれから先において最初に 亡くなる順番が私にまわってきていることになる。もっともそれが一番望ま しいことではある。我が子に先立たれることほど悲しいことはない。子供よ り一分一秒でも先に死にたいとは、お年寄りからよく聞く言葉である。
法曹関係の人は「被」という接頭字を気楽に使うようである。あるとき表彰 人・被表彰人という使い分けを目にしたことがある。表彰人とは表彰状を渡 す人であり被表彰人とは表彰を受ける人である。初めて聞いたときはとても 奇妙な感じであった。よく考えると簡単で分かりよい。他に適当な用語はた ぶん無い。ただし聞いた人は怪訝な顔をするに違いない。
送り仮名に対して送られる部分を呼ぶのに、接頭字「被」を付けた「被送り 仮名」では通じそうにないし「原送り仮名」も駄目である。適切な用語が思 い浮かばないのでとりあえず「送り元」と呼ぶことにする。通じにくいよう なら「送り仮名の送り元」にして「以後、送り元と略す」の但し書きを入れ ることにしよう。

希望の変換候補が見つからないで最後の候補に対してスペースキーを押すと 単語登録に移行する。例えば「たぐつ(田靴)」はたぶん辞書にないのですぐ に単語登録になる。ミニバッファに「たぐつ」と表示されその後ろにカーソ ルがある。「Ta」により「▼田」とし次は「田▽Kutu」と打ち「田▼靴」と する。ここでenterを押すと本文に田靴が書き込まれる。それと同時にユー ザー辞書に「たぐつ」の読みで「田靴」が登録される。

このようにskkでは単語登録がいとも簡単にできる。skkを使い初める以前に はms-imeやatokを使っていたが単語登録は一度もしたことがない。ものを書 いている途中でms-imeやatokのツールバーから単語登録のダイアログを引き 出して読みを入力するというのは面倒である。快調な打ち込みを中断しなけ ればならない。指先どころか思考の流れまでが滞ることになる。skkなら本 文に入力できた時点で既に登録完了している。単語登録したことを意識しな いままに終わるくらいに簡単である。

自分の名前が漢字変換されなくて焦(じ)れったい思いをすることがある。単 語登録しなくても辞書にありさえすれば辞書の学習により次回から候補とし て早く出るようになるだろう。もし辞書にエントリがなければ自分で登録す るしかない。skkなら簡単にできる。

辞書登録をためらう理由には方法がよく分からないことに加えて間違った単 語を登録したら厄介だというのがある。そしてデフォルトの辞書を破壊する ことになるのではの不安もある。skkでは呼び出し専用の基本辞書とユー ザー辞書の二つを使う。ユーザー辞書はよく使う単語を登録することで変換 の度に巨大な基本辞書を検索しないようにする。そのほうが変換が速くな る。そして基本辞書にはない単語を登録する場所がユーザー辞書になる。仮 名漢字変換のリクエストがあったとき、先ずはユーザー辞書の中を探し、見 つからなかったら基本辞書を検索する。それでも無かったら単語登録に移行 する。ユーザーの検索履歴とか登録単語はすべてユーザー辞書に記録され る。基本辞書は読み出しだけで書き込まれることはない。何年経ってもイン ストール当初のものから変わらない(こういう当たり前すぎることは誰も言 わない)。

単独の「っ」を割り当てているローマ字を調べてみると、atokでは「xt」 「lt」である。me-ime 2000では「ltsu」、「ltu」、「xtu」であった。 skkでは「xtsu」と「xtu」になっている。

skkのローマ字仮名変換テーブルでは「xt」に仮名の割り当てがない。そこ で「xt」に「っ」を割り付けることにする。「いわずもがな」のことである が「xt」の後ろに英字がくるローマ字を定義してはいけない(また、単独の 「x」に仮名を割り付けることができないことも当然である)。実際に skkime98では「xt」に「っ」を割り当てている。

(1)「xt」を入力する
「x」を入力した時点では対応する仮名が存在しないので「x」を表示して ローマ字の二字目の入力待ちになる。次に「t」が入力されると「xt」に対 応する「っ」の表示に代わる。
以下で普通にはありえない操作をする。いわゆる思考実験である。
(2)「Xt」を入力する
shiftキーを押しながら「x」すなわちラージエックス(X)を入力する。skkは 英大文字を仮名漢字変換開始と解釈するので「▽x」を返してくる。大文字X はローマ字仮名変換テーブルに用意されてないので等価なxに置き換えられ る。「x」に相当する仮名は存在しないのでローマ字の二字目待ちになる。 次に「t」を押すと「▽x」における「x」が「xt」に相当する「っ」になり 「▽っ」の表示になる。ここでスペースキーを押すと変換候補を検索するが 残念ながら基本辞書にもユーザー辞書にも「っ」に対する(漢字)変換候補は 存在しない。すぐに辞書登録に移行する。ミニバッファに「っ」が表示され てその後ろにカーソルがある状態で止まる。
(3)「XT」、「xT」を入力する(不確定、不安定入力)
「っ」に割り当てたローマ字「xt」の第二文字目を大文字で入力するケース は機械(ソフト)を混乱させる。「っ」を送り元に残すのか「っ」から送り仮 名を始めるのかを決められない。機械ごとに対応が違うと思う。
skkime98を使うと「XT」に対しては「▽っ*t」となり、「xT」では「▽っ」 そして「KaxT」では「▽かっ*t」になる。この二つは機械によってどのよう に処理されるか分からない。思考実験からは「Xt」で問題は起きない。たぶ ん機械にとってもそうだろう。

これは「っ」を二文字のローマ字に割り当てることからくる面倒である。ワ ンキーに割り当てれば問題なくなる。英字の中にローマ字に割り当てられず に残っているものはない。l, q, xなどの馴染薄いキーもローマ字割り付け ではしっかり使われている。

skkでは「l」と「q」をローマ字に割り付けない(詳しくはローマ字第一文字 目に使わない。それらで初まるローマ字はない。skkでは割り当て例がない がskk-azikではローマ字二文字目以降にl, qがどんどん使われる)。「l」は アスキー仮名トグルスイッチになっている。トグルとは交互切り替えで押す 度にアスキーと仮名の間を行き来する。「q」は仮名トグル、ひらがなとカ タカナの交互切り替えになる。

自作skk-azik.vimでは「っ」を「;」と「+」の両方に割り付けている。 windows常用の仮名漢字変換であるms-imeやatokでは記号に仮名を割り当て ることができないらしい。実際それらのローマ字仮名変換テーブルに記号は 現われない。需要がないから記号に仮名割り付けしないのか、記号に仮名を 割り付けしようとすればできるのか、それともそもそもそういうことは想定 外で構造的に不可能なのだろうか。

skkにおいてセミコロンやその大文字であるプラスに「っ」が割り当てられ ることはとても好都合なことである。デフォルトskkではssとかttの二連続 子音文字で単語の中間に挟まる「っ」を打てるからそれほどの有り難みはな い。azikはssやttにローマ字割り付けがあるので「っ問題」が発生する。

これで試行実験を終わる。次は実際に辞書にある単語を検索する実例を考え る。「MoXt」を入力する場合を考える。「MoX」とした時点で「▽も*x」の 表示になる。次に「t」を入力するローマ字「xt」に相当する「っ」とな り、送り元が「も」で送り仮名が「っ」で始まるエントリすなわち辞書から 「もt」を検索する。

もt /持/盛/以/保;(維持) 体が保たない/
もっt /以/

最初の候補「▼持っ」を表示する。スペースキーを押すと次の候補の「▼ 盛っ」などに移る。

こんどは「MoxtT」とする場合を考える。「Moxt」と打つと「▽もっ」と表 示する。続けて「T」を打つと「▽もっ*t」の表示に変わる。送り元が「 もっ」で送り仮名第一文字目として「t」で始まるローマ字の二字め待ちに なる。アスタリスクは送り元と送り仮名の境界を表す。次に「e」を打つと 送り元が「もっ」で送り仮名を「て」とするように辞書から「もっt」を探 しだして候補「▼以て」を表示する。候補は一つしかないのでスペースキー を押すとミニバッファに「もっ*て」と表示され逐次入力兼単語登録モード に入る。

skk-azik.elでは「っ」をセミコロン(;)に割り付けている。「Mo;T」に対し て「▽もっ*t」が返り「e」を続けることで「▼以て」の候補表示になる。 また「Mo+」ならすぐに「▼持っ」の候補表示になる。これは辞書から「も t」のエントリを探している。通常の「っ」には「;」を、送り開始の「っ」 には「+」と余計なことは考えなくてすむ。

自作skk-azik.vimではプラス(+)にも「っ」を割り当てたうえで skk-azik.vimのskk_henkan_point_keysに「+」を付け加えることで「っ問 題」が解決している。

skkime98の設定ファイルdefault.elのazik化では「っ」を割り当てるローマ 字をデフォルトの「xt」から「tt」に変更する。そのほうが打ちやすいと考 える。skkime98では記号(;)に「っ」を割り付けることができない。そこで 単独の「っ」を打つには「tt」を使い、送り仮名開始の「っ」の場合は 「Tt」を使うことにする。指が滑って「TT」としても見掛けが違うだけで深 刻な不都合はないようである。ややこしいところでは一時停止してよく確か めて「Tt」を使うのが無難である。

上記思考実験のヒントになったのは次の記事です。

「SKK+AZIK+英語キーボードで「使った」など、送り仮名が「っ」から始ま る単語に変換したい場合に、「Tuka;ta」と入力すると、「つかった」とそ のまま表示されてしまっていた。
その場合は、「TukaT;ta」と入力すると、正しく変換される。」

送り仮名に関する「っ問題」はskk特有の問題である。skkでは送り仮名の開 始文字を自分で指定する。その方法はshiftキーを前置することである。送 り仮名を送られる側(送り元)の漢字予定部分は既に変換(未確定)状態にあ り、送り仮名開始指定として二回目のローマ字第一英字を大文字で入力する ということになる。「xt」に「っ」を割り当てたなら、「っ」からの送り仮 名開始にあたっては「Xt」を使うことになる。正統azikに従うなら「;」に 「っ」を割り当てるのでshift+;=+により「っ」が送り仮名開始文字として 認識される仕掛けを用意しなければならない。

仮名漢字変換としてms-imeやatokといった普通の(大多数の)ものを使うなら 送り仮名開始文字なんて考える必要はない。それらの面倒はまとめてms-ime やatokがみてくれる。送り仮名を含む(未確定の)仮名文字列をそのまま画面 に表示(入力)して変換キーのスペースを押せば自動的に正しく送り仮名が送 られる。

| | コメント (0) | トラックバック (0)

2010年10月19日 (火)

skkime98でazikを動かす

skkime98でazikを動かす

Time-stamp: "Sun Jul 18 08:01:02 JST 2010"

skkime98でazikを使う方法を公開している人は見付からない。skkime1.0の windows2000用が2002/10/30に出たらしい。その頃がskkime98の最終版だろ う。10年経ったwindows meのサポートは打ち切られているし使っている人は 少ない。見つかるのはwindows 2000以降用のskkime1.0やskkime1.5の情報ば かりである。

skkime98に関しての情報は開発元が詳しい。

「パッケージに添付されている ReadMe.TXT を読むのが一番なのですが、取 り敢えず問題になりそうなところだけをここに抜き出して書いておきます。
(省略)
default.el を直接編集されてもかまわないですが、削除してしまったりし ないで下さい。default.elが無くなると…仮名入力程度しかできなくなりま す。」

skkime98の設定ファイルはc:\windows\ime\skkime98\config\default.elに なる。少しの変更ならキーボードのプロパティからskkime98 1.0のプロパ ティを開いて表示されるテキストエリアにlisp式を書いてもよい。

default.elの中ではskk-rom-kana-rule-list及びskk-rom-kana-aから skk-rom-kana-oまでが定義される。後者はaeiouの5種類の母音グループから なる。skkime98デフォルトのdefault.elのskk-rom-kana-rule-listには撥音 (ん、ン)しか定義されていない。他の文字は5種類のローマ字末尾毎にaeiou に分けた定義になる。5つに分けたのはスキャンスピードを上げるためかも しれない。

meadow用の本家skkのローマ字入力をazik化するskk-azik.elでは skk-azik-additional-rom-kana-rule-listにおいてazik追加データが定義さ れる。次のような形式のデータが延々と続く。ここに現われるnilの意味に ついてはskk-vas.elに説明がある。

  ("ca" nil ("チャ" . "ちゃ"))

skkime98の設定ファイルであるdefault.elのskk-rom-kana-rule-listには撥 音しか定義されてないので仕組みが分からない。そこでskk-rom-kana-aから skk-rom-kana-uまでを改造してみる。

skk-azik.elのskk-azik-additional-rom-kana-rule-listはデフォルトの ローマ字仮名変換テーブルに加えるべきazikのテーブルである。これから ローマ字の末尾がa, e, i, o, uであるものを抽出する。

なお、skkime98のdefault.elにおけるskk-rom-kana-rule-listとローマ字末 尾母音別のskk-rom-kana-aからskk-rom-kana-uまでとではデータ形式が異な る。前者ではカタカナ、ひらがなの順番であるが後者では逆転した順序に並 ぶ。またnilの文字はない。

  ("" . ("あ" . "ア"))

とりあえずskk-azik.elから抽出したローマ字が母音aで終わるデータを改造 してskk-rom-kana-aのデータの後ろにくっつけてみる。こうしても修整前の ものしか仮名変換されない。実はskk-prefix-listに付け足さなければいけ ないものもあるのだが最初はそのことに気付いてない。

skk-prefix-listはskk-rom-kana-rule-listやskk-rom-kana-aなどにおける ローマ字の二重や三重の先頭子音文字を仮名変換候補と認識させるためのも のらしい。ローマ字仮名変換を開始する文字の登録である。ただし子音字は 登録しなくても変換開始となる。二文字以上のプリフィクスを登録する。

試行錯誤するうちにローマ字データがアルファベット順にソートされていな いせいではと閃く。データを先頭からスキャンしてゆき候補が見付からな かった時点でスキャンを打ち切る。例えば先頭からcaを探す場合において、 dで始まるローマ字データの後にcaが存在していたのではデータの頭文字dに 到達した時点でスキャンが打ち切られcaが検出されないで終わる。そこで skk-rom-kana-aなどのデータの末尾に補充したデータを含めてグループ毎に アルファベット順に並べ換える。追加分は10個程度だったので目視でソート する。

こうしてskk-rom-kana-aに補充したaで終わるローマ字がひらがなに変換さ れるようになる。ここで動くようになった以外のデータ、例えば子音文字二 個連続といったaoiueで終わらないazik独特のものは skk-rom-kana-rule-listに収容するしかない。母音文字で終わるデータを取 り去るのは面倒なので変換データすべてをアルファベット順にソートして skk-rom-kana-rule-listに入れてみる。

それでもローマ字仮名変換ができる。そこでskk-rom-kana-aなど五つを削除 する。そうすると「aeiou」だけが変換されないトラブルになる。 skk-rom-kana-a以下を復活させて「あえいおう」の各一文字だけのデータを 残し他を削除する。それで「あえいおう」が出るようになる。こうなると 「あえいおう」はskk-rom-kana-rule-list及びskk-rom-kana-aなどでの二重 登録になる。そこでskk-rom-kana-rule-listから「あえいおう」のデータを 削除する。それでも問題ない。ここまで来たらskk-rom-kana-rule-listから 末尾がaeiouで終わるローマ字データをskk-rom-kana-a以下に移動させたほ うがよいのかもしれない。不自由はないのでそのまま使っている。

DEFAULT.EL.txt (skkime98のazik化、現用中の試作版です)

ブラウザからファイル内容が見えるようにファイル拡張子を「.txt」にして います。なお、これをブラウザで閲覧すると文字化けします。ブラウザの encodingをShift_JISに変更してください。このファイルをダウンロードし て拡張子「.txt」を取り去ったものにリネームして c:\windows\ime\skkime98\config\default.elと置き換えるとazik化された skkime98になります。

(注)DEFAULT.EL (azik版)では「っ」を「tt」に割り付けています。「っ」 で送り仮名が始まる場合は「Tt」か「TT」を使います(Ttのほうが無難)。 「ん」はノーマルな「nn」になります。

skkime98のdefault.elでは記号に仮名を割り当てること、そして記号に別の 記号(半角記号に全角記号をとか)を割り当てることはできないようです (ms-imeやatokでは記号に仮名は割り当てられないらしい?)。なお、記号に 別の記号を割り当てることはキーボードのプロパティのskkime98のプロパ ティに現われるテキストエリアにlisp式を書くことで一部可能なようです。

skk-azik.vimのテストではテキストエディタvimだけを再起動することで windowsを再起動しなくても修整したskk-azik.vimを読み込んでくれる。し かしskkime98はwindowsを再起動しないと修整したdefault.elを読み込んで くれない(ようです)。

ウィルスソフトのavast!をインストールしているので再起動に5分くらいか かる。朝の起床と同時にパソコンのスイッチを入れるを日課としている。ト イレと洗面を済ませてパソコンの前に戻ってもビジーが続いており反応が遅 い。再起動毎にこの状態では仕事にならないのでavast!をアンインストール せずに殺す方法を考える。

スタートボタンからファイル名を指定して実行でmsconfigを起動する。 msconfig(システム設定ユーティリティ)からスタートアップタブを出して avast!に関係ありそうなavast! web scanner、ashmaisv、avast!のチェック を外したら画面下タスクバー右端の時計のそば(タスクトレイ)にアイコンが 出なくなる。パソコンが軽くなって気軽になる。そろそろパソコンを買い替 えなくてはと思う。

| | コメント (0) | トラックバック (0)

2010年10月 9日 (土)

拡張ローマ字入力azik方式の着眼(idea)

拡張ローマ字入力azik方式の着眼(idea)

Time-stamp: "Tue Jul 13 15:09:37 JST 2010"

ローマ字入力azik方式については開発者のホームページが詳しい。

詳細な解説のページは助かるのであるが詳しすぎて、エーッ、そんなに憶え なきゃナランのとウンザリしないでもない。簡潔な絡繰り(からくり)解説を 知りたいなら開発当初の論文を当たるのが常道である。発案当時の生々しい 舞台裏が垣間見えるような原初原典を当たるべきである。後で書かれたもの は整理されすぎて却って分かり辛いことはよくある。

開発者の木村清(きむらきよし)氏は宮城県の尚絅学院大学(しょうけいがく いんだいがく)教授である。azikについて書かれた次を読むことができる。

なお、掲載サイトは国立情報学研究所とある。

  • CiNii - NII論文情報ナビゲータ(国立情報学研究所)
    National Institute of Informatics.
    http://ci.nii.ac.jp/

なお、尚絅学院大学(宮城県)と類似する名前の尚絅大学が熊本県にある。な んとも紛らわしいことになっている。同じ尚絅(しょうけい)を名乗るが二つ の大学は無関係らしい。

上記の論文「学習の移行性を重視した拡張ローマ字入力 -azik-」に次の記 述がある。

「ローマ字変換テーブルを拡張する。ここでいう拡張とは、通常のローマ字 では割り当てられていない、2ストローク目に子音キーが打鍵された場合に もかなに変換することを指す。分かち書きした通常の日本文かなデータ約5 万字における、2連続文字パターンの頻度を調べた結果、頻出パターンは以 下の3種に大別できる。
  1. 2文字めに「ん」がくるパターン
  2. ai, ei,uu, ouという二十母音
  3. 「した」、「する」、「こと」、「から」などの頻出文字列
これら3つの類型を考慮し、ローマ字テーブルの拡張をそれぞれ撥音拡張、 二十母音拡張、特殊拡張に分けて行なう。」

また、拡張の基本方針は次の二つとしたとある。

現行のローマ字入力との互換性を極力保つこと
この手の入力方式の改善を必要とするユーザは、初心者でも専門タイピスト でもない人達である。つまり、ある程度ローマ字入力できるようになってお り、日々の仕事がある中で新方式の学習による効率低下を避けなくてはなら ない状況にある人達である。後述のように本方式では、現行のローマ字入力 法と互換性があり、拡張部分の入力方法を忘れてしまっても、従来の打ち方 で入力できるため、実践の場で自然に新方式に移行できる。
覚えやすいこと
ローマ字変換テーブルを拡張した部分のキーの割り当ては、主に指の動きの イメージから連想できるキー配置とした。例えば「カン」と入力する場合の キーは本方式では「KZ」である。これは「カ」を入力するときに、Kの次に Aを打つための左小指の動きが引き起こされる行動パターンができているか らである。この行動パターンに基づいて同じ左小指で対応する読み+撥音の 入力ができるようにキーを割り当てた。なお、この考えは筆者にオリジナル があるわけではなく、SKY配列からヒントを得ていることをお断りしてお く。
なお、本方式は次節で伸べるように、Aの拡張をZキー、Iの拡張をKキーに割 り当てることからAZIK方式と呼ぶ。」

これを読んでから作者のホームページの記述を見るとスンナリ分かる気がす る。なお、SKY(すかい)配列の関連情報として次が参考になる。

「自分は今、AZIKの配列でローマ字入力を拡張している。覚えた頃は全く考 えもしなかったが、ある時思い出してみれば、これはSKY配列の思想に非常 によく似ている。実際、調べるとAZIKの考案者の木村清氏は、SKY配列を参 考にしたと述べている。SKY配列は、全く独自の発想で、QWERTY配列とは無 関係な全く新たなキー配列であるが、AZIKはQWERTYを元にして、それを拡張 している。SKY配列では母音が右手に集中している為に、二重母音や撥音拡 張も右手の母音の同じ列に揃えられているのが覚えやすいと思う。
AZIKは、現行のローマ字入力の拡張である為に多少拡張キーが散在してしま うのだが、AZIKの最大の特徴は、既に周到しているローマ字入力の資産を最 大限に生かして入力の効率化を図るということなので、それについては納得 できる。つまり、全く新たに覚えるのに覚えやすいとされるSKY配列を現行 ローマ字を習得した状態で覚えやすい方式として考案されたのがAZIKである とも言えるので、つまり、既にローマ字入力を習得している人が最短距離で 入力効率の向上を行える可能性が高いのが、AZIKなのである。」

azikを知ったとき、先ず気になったのはユーザーの評判と作者はいったい誰 だろうかである。品物を買う人が「くちコミ」とメーカー名、そして値段で それを買う買わないを決めるように。簡単に自作できるものでないかぎり チョット見で品物を買うことはない。得体の知れないものにはなかなか手が 出ない。そういうときは先人(人柱となった人)の話しを聞く。勧める人が多 いなら大丈夫だろう。自分の判断に自信が持てないときは人が集まっている かどうかで判断する。迷いがあるときは結局「みんなの意見は案外正しい」 にしたがう。それがいちばん無難で楽だから。

「ちなみに、個人的に気になったのは中盤に出てくる「マタイ効果」の話。  「有名な科学者の研究はさほど有名でない科学者の研究に比べて、膨大な 数の引用がなされる。」という科学者の論文における「名声のパワー」の事 例を紹介しているのですが、最近のブログ界も同じことが起こっている気が して、この認知と質のアンバランスの問題を技術によって解消することがで きるのかどうかが気になるところです。」(ウッ、耳が痛いッ(笑))

azikを使い始めて間もない人の書いたものにはそれを始めるに至った動機と か習得にあたって苦労したことなどの披露がある。事後に整理されて体裁の 整った最終報告書よりも、舌足らずな一方で消し忘れた本音が残っているよ うな現場からの第一報に、もっとも知りたい真相が書かれていることが多い に似ている。作者のページはコマーシャルとして聞き流し、「くちコミ」で ある次の二つのページに耳を傾ける。ゴーサインとなってから作者のページ を読み返した。エライ先生は話しが上手いからその気にさせられる。そして 身近な人の評判を聞いたら、ヤルしかない。

| | コメント (0) | トラックバック (0)

« 2010年9月 | トップページ | 2010年11月 »