[Enter] キーを押すことを意味します。
STEP 2 では、PDIC 形式の辞書ファイルを Unicode 形式のテキストファイルに変換し、それを編集し、再び PDIC 形式の辞書ファイルに変換する方法を説明します。この方法を使えば、英語と日本語以外の言語を扱う辞書ファイルを Perl で処理できるようになります。
次に、ほぼ同じやり方で PDIC 辞書ファイルを XML 文書に変換してみます。XML 文書を処理できるソフトウェアは数多く存在するので、いろいろと可能性が広がるでしょう。
PDIC-Toolkit で Unicode の日本語を扱うためには、Jcode.pm が必要です。次の手順に従って、ダウンロード&インストールしてください。
Jcode-X.XX.zip(執筆時点では X.XX = 0.79)へのリンクをクリックして、適当なフォルダ(例えば、C:¥temp)にダウンロード。jcwin-X.XX.zip をダウンロードし、適当なフォルダに解凍してください。新しくできる perl フォルダをコピーし、C:¥ に貼り付けてください(Perl を C:¥Perl にインストールした場合)。「このフォルダには既に'perl'フォルダが存在します」という確認メッセージが表示されたら、[すべて上書き] を選んでください。さらに「このフォルダには既に読取専用ファイル'Jcode.pm'が含まれています」という確認メッセージに対しても [すべて上書き] を選んでください。
コマンドプロンプトを開いて、次のコマンドを実行すると、C:¥home¥pdic のサンプル辞書ファイル greek.dic が Unicode 形式のテキストファイル greek.txt に変換されます。
greek.txt をテキストエディタで開くと、次のように表示されるでしょう。
greek.txt を表示・編集するには、Unicode 形式に対応したテキストエディタまたはワードプロセッサが必要です。Windows NT/2000/XP に付属する「メモ帳」は Unicode 形式に対応していますが、Windows 95/98(たぶん、Windows Me も)に付属する「メモ帳」は対応していません。MS Word(たぶん、Word 98 以降)は、Unicode 形式のテキストファイルを読めますが、保存できません(少なくとも、Word 2000 では)。
メモ帳に戻って greek.txt を適当に編集し、上書き保存してメモ帳を終了してください。そして、コマンドプロンプトに戻り、次のコマンドを実行します。
greek2.dic was successfully created. と表示されたら、PDIC 辞書ファイル greek2.dic の出来上がりです。PDIC に読み込んで、変更が反映されているかどうか確認してください。
PDIC 辞書ファイルを XML 形式に変換することもできます。次のコマンドで greek.xml を生成し、ダブルクリックしてみましょう。Internet Explorer(Ver.5 以降)がインストールされていれば、辞書データのツリー構造が表示されるでしょう。
逆に XML 形式のファイルから PDIC 辞書ファイルに変換するには、次のコマンドを入力します。
PDIC Toolkit Tutorial - Step 3 では PDIC Toolkit を使って、PDIC から特定の条件を満たす項目だけを抜き出す方法を説明します。
黒田努 <tkrd@mail.com> (2002.02.20) (2002.02.27)