#blognavi

正字正假名SKK辭書(20070312版)


※注: 最新版は ブログ/カテゴリ/正字正假名 にて確認のこと!!!

1. 特長


  • 正字正假名《かな》で入力された單語を變換《へんくゎん》する辭書《じしょ》(字音假名を含む)
例: (入力)OmoHu -(變換)-> (出力)思ふ
例: (入力)Tehu -(變換)-> (出力)蝶
  • 正假名遣ひ學習用として使用可能。
    辭書の例:
かいたふ /解答/
かいとう /囘答《くゎいたふ》/解答《かいたふ》/怪盜《くゎいたう》/
くゎいたふ /囘答/
  • 「かいとう」を變換すると「囘答《くゎいたふ》」などと出るので、確定して不必要なところを消すなり、全部消して新に入力するなりする。
  • 「かいたふ」や「くゎいたふ」などの入力で「解答」や「囘答」を即座に出力可能。
  • JISX0208にのみ對應《たいおう》。この範圍内《はんゐない》で可能な限り正字を使用。
  • 辭書ファイルは SKK-JISYO.L 等をプログラムにより變換《へんくゎん》して作成。
    筆者自身は辭書を編簒してゐないことが最大の特長。
  • 變換プログラムは以下のデータを利用して SKK-JISYO.L 等を解析し正字正假名 SKK-JISYO を作成。

2. ダウンロード



SJIS/DOS 改行コード版は、本來、Emacs を使ふ人には必要ないでのだが、
Emacs を使はない人でもファイルを見てゐるだけで樂しくなつてくるのでは無いかと思ひ作成。

3. 含まれる各ファイルの説明


3.1 SKK-JISYO.*.SEI.*, SKK-JISYO.*.SEI2.*


正字正假名用 SKK辭書。通常は SKK-JISYO.*.SEI を使ふ方が良いでせう。

SEI と SEI2 の違ひは、例へば、SKK-JISYO.L.SEI は、「東京」を出力する爲に、
とうきやう/とうきゃう/とぅきゃぅ
などの幅のある入力を受附けるが、SKK-JISOY.L.SEI2 は、
とぅきゃぅ
の入力しか受附けない。

平成疑問かなづかひのデータは、ng發音(鼻腔音)を「ぃ」や「ぅ」やと表現してあるので、
SKK-JISYO.*.SEI2 はそのデータに嚴密に從つた。
しかしこの表記方は一般的では無いので、入力に幅の有る SKK-JISYO.*.SEI も用意した。

またその他に、字音と訓の辭書を分けておきたいといふ要望に應へるため、これらの辭書を以下のやうに分割した辭書も生成濟み。
SKK-JISYO.*.SEI*.ziom 音讀み辭書
SKK-JISYO.*.SEI*.kun 訓讀み辭書
SKK-JISYO.*.SEI*.dyubako 重箱・湯桶讀み辭書
SKK-JISYO.*.SEI*.fail 解析に失敗した單語の辭書

3.1.1 SKK-JISYO.ziom.SEI*

ziom.htm から作成した SKK辭書。

3.2 seizi-kanzi-list.el


解析の爲、中間的に作られるデータ。SKK/Emacs/Elisp など何も分らなくても、
見てゐるだけで樂しくなつてくるかも。

3.3 seiji.el


Emacs上で入力した文章を、略字現代假名遣や正字正假名假名遣ひに相互變換する凾數群。
http://www.zinbun.kyoto-u.ac.jp/~dokisha/archives/elisp/kana.el を改變しました。
有難うございました。

.emacs で
;; seiji
(load-library "seiji")
(define-key global-map "\C-x:" 'seiji-ryakujigendaikana)
(define-key global-map "\C-x;" 'seiji-seijiseikana)
(define-key global-map "\C-x." 'seiji-ryakujigendaikana-line)
(define-key global-map "\C-x," 'seiji-seijiseikana-line)
(fset 'seiji-ryakujigendaikana-line
   [?\C-  ?\C-a ?\C-x ?: ?\C-x ?\C-x])
(fset 'seiji-seijiseikana-line
   [?\C-  ?\C-a ?\C-x ?; ?\C-x ?\C-x])
などと設定して使用のこと。

3.4 SKK-JISYO.L 等


辭書の元となるデータ。これを變換して上記ファイルを作成。

3.5 tikamiti.htm, ziom.htm, kunziom.htm, pubdic.p


解析に用ゐられるデータファイル。

3.6 seizi-const.el


「正(旧)仮名遣ひ 現代(新)仮名遣い」相互変換〜まるやるま君
から作らせてもらひました。有難うございました。

3.7 seizi-prepare.el


SKK辭書解析變換プログラム。ドキュメントは無し。
コードと Makefile とを見て使ひ方を推測のこと。
Wanderlustの内部凾數《かんすう》を一部使つてゐるので注意。

3.8 seizi.el


seiji.el を將來的に置換へる豫定のプログラム。未完成。

3.9 dot-skkinput


.skkinput ファイル。
「kwi」から「くゐ」を出す爲に skkinput 自體《じたい》も弄つたが現在非公開。
筆者は skk.el を使はず、skkinput のみ使つてゐる爲、.skk は持つてゐない。

4. Tips


辭書は、
かいとう /囘答《くゎいたふ》/解答《かいたふ》/怪盜《くゎいたう》/
となつてゐますが、Emacs 等で置換して、
かいとう /囘答;くゎいたふ/解答;かいたふ/怪盜;くゎいたう/
とするのも一つの方法でせう。

かうすれば、現代假名使ひで入力して確定しても餘計なものが出ることが無くなります。

5. 知られてゐるバグ等


  • 漢字が八文字以上の長さになる單語が辭書に無い。
    これは仕樣。
    筆者は普段から SKK での入力で、それほど長く入力しませんし、それに字音をそんなに長いこと正確に打てません。
  • 餘計《よけい》な候補が含まれる。
    少しづつ直していく豫定《よてい》。
    取敢へず使へれば良いので、足りないのは困るが、餘計な物がある分には困らない。

バグ情報をコメント欄に書いてもらへると有難いです。
しかし對應に過度の期待はなさらぬやう。

名前:
コメント:


カテゴリ: [正字正假名] - &trackback() - 2007年03月12日 21:51:59

#blognavi
最終更新:2011年02月08日 18:11