«前の日記(2006-06-30 [金]) 最新 次の日記(2006-08-04 [金])» 編集
RSS: href="http://endoh-namazu.tierra.ne.jp/diary/index.rdf"


半期 四半期 全カテゴリ

新・なまず日記


2006-08-02 [水]

_ [カスタマイズ][ソフト][AHK]イタリア語のEPWING辞書

なまずの両親が、今年、金婚式なんですよ。それで、その記念ということで、今度の夏休みに、家族一同で、イタリア旅行に行くことになりました。いいでしょ。

なまずはイタリア語はぜんぜんわからないので、せめて辞書でも買って行こうかと、EPWING形式の電子辞書を探してみました。しかし、これがないんですよね。唯一、CD-現代イタリア語表現辞典というのが見つかっただけ。イタリア語といったらチャオしか知らないのに、イタリアの現代用語がわかったって、ねえ。

しかし、いろいろ調べてみたら、ジャッピタルウェブさんが、なんとフリーで、GIAPPITALIXという、ご自作のイタリア語辞書を公開されていることがわかりました。収録語数、なんと5万4千語。これがフリー!なんとすばらしいのでしょう。

この辞書は、PDICという辞書形式です。PDICは、sgm00353@nifty.ne.jpさんが開発された辞書閲覧ソフトで、業界団体が策定したEPWING形式とは違い、個人が語学の勉強用に単語帳を作る感じで自分用の辞書を作れるようになっており、非常に素晴らしいものです。

しかし、なまずは、普段からEPWING形式の辞書閲覧ソフトであるDDwinを愛用しており、閲覧ソフトをDDwinに統一したかったし、また、PDICはシェアウエアで、継続的な使用には、1,000円のお金を支払わなければならなかったので、PDICを使うのはちょっとためらわれました。そこで、PDIC形式であるGIAPPITALIXを、EPWING形式に変換して、EPWING電子辞書として、DDwinで閲覧することにしました。今回は、その変換の手順と、変換プログラムを、紹介したいと思います。

用意する(ダウンロードする)ソフトは、以下の通りです。

  1. GIAAPTALIX
    これがなくちゃ始まらない、ジャッピタルウェブさん作成の伊日辞書です。
  2. PDIC for Win32
    sgm00353@nifty.ne.jpさん作成の辞書閲覧ソフトです。今回は、GIAPPTALIXを、テキストファイル(PDIC1行テキスト形式)に変換するだけに使用します。いろいろバージョンがありますが、for Win32版を使います。
  3. giapp_ebhtml.exe
    2.で変換したテキストファイルを、EBStudio(後述)が処理できるhtml文書に変換するために、なまずが書いた変換アプリです。例によってAutoHotkeyでスクリプトを書いて、コンパイルして実行形式(exe)にしたものです。ソースコードはこちら。
    このアプリは、以下のようなことをします。
    • GIAPPTALIXは、イタリア語のアッチェント付き文字(àのような文字)を表現するために、一部、Latin-1文字コード(0xeo等)を使っております。このような文字はJIS文字コードでは定義がなく、日本語のWindows環境では入力することができない(たぶん)し、そもそもEPWING規格ではJISコードと外字で文字を表現するルールなので、そのままでは文字化けになってしまいます。そこで、思い切って、見栄えは悪いですが、以下のようにバッククオートとシングルクオートを使って、2文字に変換してしまいます。
      • à → a`(a+バッククオート)
      • è → e`(e+バッククオート)
      • é → e'(e+シングルクオート)
      • ì → i`(i+バッククオート)
      • ò → o`(o+バッククオート)
      • ù → u`(u+バッククオート)
    • GIAPPOTALIXでは、以下のような、縮小辞(Dim.)などの単語の列挙がありますので、
      abete /// ([衆]abeto; [古・トスカ]abezzo)【s.m.】[植]樅{もみ};
      樅の木, 樅材【Dim. abetello, abetino; Accr. abetone.】
      
      このような活用形で検索した場合でも、該当単語が検索できるよう、検索キーワードの追加を行います。

    • GIAPPOTALIXでは、以下のような、参照語指定(<word>)がありますので、
      abile /// 【agg.】1】(in, a+inf.することに)有能な, 才能ある;
      得意な, 巧みな, 器用な, 熟練した  Sin.<word:adatto>
      
      この参照後をクリックしたら該当箇所にジャンプするよう、リンクを張ります。

    • その他いろいろ
  4. EBStudio
    hisidaさんが開発した、EPWING対応辞書を作成するアプリです。テキストベースの、さまざまな形式の辞書データを、EPWING形式に変換することができます。ここに、前述したgiap2eb.exeが変換したhtmlファイルを食わせるわけです。1,155円のシェアウエアですが、送金しなくても、前方一致検索機能のみの辞書なら、作成することができます。

では、上記4つのアプリの使い方を以下にご説明します。

  1. まず、ここから、GIPPITALIX w0.11.17をダウンロードして(Uicode版ではありません)、適当なフォルダに解凍します。
  2. 次に、ここから、PDIC for Win32をダウンロードして、インストールします。PDICを起動したら、メニューの"Tools"→"辞書の変換"を選択、「転送元辞書」に、1.でダウンロードした"gdig01117w.dic"を指定し、「転送先辞書」は、"一行テキスト形式"を選択して、適当な出力ファイル名を指定します。これで"OK"を押せば、あっというまに変換は終了です。これで、PDICはアンインストールしてしまって結構です。
  3. 次に、giapp_ebhtml_exe_v10000.zipをダウンロードします。適当なフォルダに解凍して、中の"giapp_ebhtml.exe"を起動します。"1行PDICテキストファイル"を聞いてきますので、2.で変換したファイルを指定します。次に出力先のhtmlファイルを聞いてきますので、適当な出力ファイルを指定します。すると変換が始まります。giapp_ebhtml.exeは、GIAPPITALIX内の記述ミスを、適当に解釈しますので、気になる方は、giapp_ebhtml.exeと同じフォルダにできるログファイル"giapp_ebhtml.log"を参照して、出力したhtmlファイルを手で修正してください。
  4. GIAPPITALIXは、学習用辞書ではないので、基本的な動詞の活用などはあまりのっていません。つまり、"ho"で検索して、"avere"が出てこないわけです。「そのくらい憶えとけよ!」ってことなんでしょうが、「やっぱ出てきて欲しいよなあ」という場合は、htmlファイルを手で編集しましょう。例えば、なまずは、以下のような記述を手で加えました(赤い字がなまずが手で加えたところ)。
    <dt id="avere">avere</dt>
    <key>ho</key>
    <key>hai</key>
    <key>ha</key>
    <key>abbiamo</key>
    <key>avete</key>
    <key>hanno</key>
    <dd>【v.t.】(現在形:ho,hai,ha,avviamo,avete,hanno)
    <br>持つ, 持っている; 所有する, 所持する;...
    
    <key>のタグの単語を加えると、それが検索語なって、見出し語(この場合"avere")が検索されるようになっています。これを、不規則活用する動詞に関して、なるたけ加えます。
  5. htmlファイルの準備ができたら、ここから、EBStudioをダウンロードして、インストールします。起動した後、"入力ファイル名"の箱の中で右クリックして、"挿入"を選択。"書籍名称"には、「伊日辞書」とでも入れて、"書籍ディレクトリ名"には、「giapp」とかなんとか。それで一旦"OK"を押します。さらに、もう一度、"入力ファイル名"の箱の中で右クリックして、"挿入"を選択。"入力ファイル"に、3.や4.で準備したhtmlファイルを指定します。"ファイル種別"は"HTML"を選択。それで"OK"を押します。最後に、メインウインドウの"出力先(必須)"に、EPWING形式の辞書を出力するフォルダを指定して、ツールボタンの"!"(ビックリマーク)を押せば、変換が始まります。
  6. あとは、DDwinで、メニューの"グループ"→"辞書グループを編集"で、5.で出力した辞書を検索して取り込めば、一応完了です。
  7. さらに便利に使うためには、ddwinに、規則動詞の活用を教えましょう。4.にも書きましたが、GIAPPITALIXは活用した動詞があまり載っていません。しかし、ddwinに、規則変化のパターンを教え込めば、規則変化する動詞だったら、ddwinが、動詞の語尾をいろいろ取り替えて、検索を繰り返してくれるので、検索がうまくいくようになります。ddwin.exeと同じフォルダに、ddwin.datというファイルがありますから、そこに、5.で指定した書籍名称(例えば"伊日辞書")のエントリを加えて、例えば、以下のように書きます。
    [伊日辞書]
    Ending=iamo,ere
    
    これで、一人称複数の語尾"-iamo"を、原型の"-ere"に取り替えて、検索してくれるようになります。なまずは、動詞の現在形、過去分詞、半過去、命令形、未来系、単語と形容詞の複数と男性女性中性の活用のパターンを、DDwinに教え込んでいます。以下に、そのデータをファイルにまとめておいておきますので、これをddwin.datに追加して使ってみてください(それで、間違いがあったら教えてください)。

    ddwin_italy.txt

    DDwinの上記の指定は、1行160バイトまでとか、9行までしか書けないとか、いろいろ制限があって、結構苦労しました。でも、パズルみたいで楽しかったな。

長々と読んでいただき、ありがとうございました。これやるのに、なまずは結構苦労したんですが、そのおかげでDDwinは賢くなったとしても、なまずは相変わらずイタリア語は全然わからないままなので、こんなことやる暇があったら、もうちょっとイタリア語の基礎を勉強しとけよ!ってことかも知れませんね。楽ができるかもって一生懸命やって、あんまり意味のない苦労をするってのが、プログラマの宿命なのかもしれません。じゃ、チャオ!

本日のツッコミ(全2件) [ツッコミを入れる]
_ カルモ (2006-11-02 [木] 22:28)

WM5.0環境で利用可能な、簡単な伊日辞書を探してこちらにたどり着きました。大変解りやすい解説で問題なく利用できるようになりました。とても感謝していますm(_ _)m

_ なまず (2006-11-03 [金] 11:21)

お使いいただきまして、ありがとうございます。<br>ところで、WM5.0とは、WindowsMobile5.0ですかね?<br>ハードはどんなものをお使いですか?

[]