辞書の変換
- 概要
- LBE 形式の辞書データを UTF-8 の CSV 形式に変換する
- LBE 形式の辞書データを UTF-16 の CSV 形式に変換する
- UTF-8 の CSV 形式の辞書データを LBE 形式に変換する
- PDIC 形式の辞書を LBE 形式に変換する
- PDIC の辞書を CSV 形式のデータに変換
- CSV 形式のデータを LBE 形式に変換
- LBE 形式に変換された辞書データをプロジェクトに登録する
- PDIC テキスト形式の辞書を LBE 形式に変換する
- PDIC 一行テキスト形式の辞書を LBE 形式に変換する
- トラブルシューティング
- PDIC の CSV 形式のデータから LBE 形式への変換途中でエラーが発生する
概要
現時点で LBE に備わっている辞書変換機能は次の 5 つです。
| 変換元の形式 | 変換先の形式 |
| LBE 形式 | CSV 形式 (UTF-8/UTF-16) |
| CSV 形式 (UTF-8) | LBE 形式 |
| PDIC の CSV 形式 | LBE 形式 |
| PDIC テキスト形式 | LBE 形式 |
| PDIC 一行テキスト形式 | LBE 形式 |
UTF-8 の CSV 形式の辞書データはテキスト文書となりますので、Unicode を扱えるエディタで開くことが
できます。
LBE 形式の辞書データを UTF-8 の CSV 形式に変換する
変換の手順は次の通りです。
-
[ツール]メニューの[ファイル変換:LBE 形式から]-[CSV 形式へ]を
クリックするとファイル変換ダイアローグが現れる。
-
「ソース・ファイル・パス」と「ターゲット・ファイル・パス」を指定する。
それぞれの欄の右にある[...]ボタンをクリックして、ファイルを選択するとよい。
-
[変換]ボタンをクリックする。
-
変換の進行を示すグラフが 100% に達したら、[OK]ボタンをクリックする。
通常、「タブ、改行、ラインフィード、バックスラッシュをエスケープする」はチェックしたままにします。
このチェックボックスは、データ中に現れるタブを "\t" に、改行を "\n" に、ラインフィードを "\r" に、
バックスラッシュを "\\" にすべて変換するかどうかを決めるためのものです。
LBE 形式の辞書データを UTF-16 の CSV 形式に変換する
変換の手順は UTF-8 の CSV 形式に変換する場合と同じです。
ただし、[変換]ボタンをクリックする前に[UTF-16]ラジオボタンをチェックしてください。
現時点では、UTF-16 の CSV 形式の辞書データを LBE 形式に変換することはできません。
UTF-8 の CSV 形式の辞書データを LBE 形式に変換する
変換の手順は次の通りです。
-
[ツール]メニューの[ファイル変換:LBE 形式へ]-[CSV 形式から]を
クリックするとファイル変換ダイアローグが現れる。
-
「ソース・ファイル・パス」と「ターゲット・ファイル・パス」を指定する。
それぞれの欄の右にある[...]ボタンをクリックして、ファイルを選択するとよい。
-
[変換]ボタンをクリックする。
-
変換の進行を示すグラフが 100% に達したら、[OK]ボタンをクリックする。
通常、「'\t, '\n', '\r', '\\' をアンエスケープする」はチェックしたままにします。
このチェックボックスは、データ中に現れる "\t" をタブに、"\n" を改行に、"\r" をラインフィードをに、
"\\" をバックスラッシュ("\")にすべて変換するかどうかを決めるためのものです。
PDIC 形式の辞書を LBE 形式に変換する
基本的な手順は、次の通りです。
- PDIC の辞書を CSV 形式のデータに変換する。
- CSV 形式のデータを LBE 形式に変換する。
逆の変換、すなわち LBE 形式の辞書データを PDIC の辞書に変換する機能は、まだ LBE に備わっておりません。
以下、例として "tkrd.dic" というファイルを "tkrd.lex" に変換するという前提で手順を説明します。
また、次の 2 つのフォルダを例として使用します。
自分の場合に置き換えて読み進んでください。
- C:\Program Files\Personal Dictionary -
PDIC 辞書データの置いてあるフォルダ(以下、「ソースフォルダ」と呼ぶ。)
- C:\Program Files\lbe\data\gjdic -
LBE 形式に変換されたデータを置くフォルダ(以下、「ターゲットフォルダ」と呼ぶ)
PDIC の辞書を CSV 形式のデータに変換
- [Tools]メニューの[辞書の変換]をクリックする。
- 左の[参照]ボタンをクリックする。
- ソースフォルダに移動する。
tkrd.dic を選択し、[OK]ボタンをクリックする。
- 転送先辞書のファイル形式として[CSV形式]を選ぶ。
- 右の[参照]ボタンをクリックする。
- ターゲットフォルダに移動する。
- ファイル名として
tkrd.csv を指定する。
- [OK]ボタンをクリックすると、変換結果を示すダイアローグボックスが表示される。
CSV 形式のデータを LBE 形式に変換
この変換によって変換される PDIC 形式のフィールドと LBE 形式のフィールドは、次のように対応しています。
| PDIC | LBE |
| 英単語 (keyword) | 索引キー(keyword) / 見出し語(headword) |
| 訳 (meanings) | 語義説明 (description) |
| 用例 (examples) | 用例 (examples) |
| 発音記号 (pronunciation) | 発音 (pronunciation) |
| レベル (level) | レベル (level) |
PDIC のデータフィールドのうち、「暗記必須単語」と「修正単語」のフラグは無視されます。

変換の手順は次の通りです。
-
[ツール]メニューの[ファイル変換:LBE 形式へ]-[PDIC の CSV 形式から]を
クリックするとファイル変換ダイアローグが現れる(右図)。
-
「ソース・ファイル・パス」と「ターゲット・ファイル・パス」を指定する。
それぞれの欄の右にある[...]ボタンをクリックして、ファイルを選択するとよい。
-
各フィールドについて[文字セット]を指定する。
どの「文字セット」を指定すべきかは、PDIC の[View]メニューの[表示フォント]で
フォントとして何を指定しているかによります。
例えば、『現代希日辞典』の場合、「英単語 」と「用例 」には "Arial Greek" が指定されていますので、
文字セットとして "Window Greek (Cp1253)" を指定します。
「日本語訳」はデフォルトの "Shift-JIS, Japanese" のままにしておきます。
『現代希日辞典』では「発音記号」は使用されていないので、"SIL Encode IPA 93" のままにしておきます。
"SIL Encode IPA 93" は、PDIC で一般的に使用されている同名のフォントの“文字セット”です。
-
[変換]ボタンをクリックする。
-
変換の進行を示すグラフが 100% に達したら、[OK]ボタンをクリックする。
LBE 形式に変換された辞書データをプロジェクトに登録する
LBE 形式に変換された辞書データを使用するためには、プロジェクトに登録する必要があります。
- [プロジェクト]メニューの[プロパティ]をクリックする。
- [追加]ボタンをクリックする。
- "tkrd.lex" を選択して、「開く」ボタンをクリックする。
- "tkrd.lex" を編集可能なレキシコンとして使用するなら、その [editable] チェックボックスをチェックする。
- [OK]ボタンをクリックする。
PDIC テキスト形式の辞書を LBE 形式に変換する
PDIC テキスト形式 は PDIC 辞書の保存形式の一つで、
辞書を公開・配布する際に使用することが推奨されています。
この形式で保存された辞書データは CSV 形式の場合と異なり、LBE 形式への変換途中で
エラーが発生することはありません。
他方、この形式には発音記号およびレベルのデータが保存されませんので、
PDIC 辞書を LBE 形式に変換するための中間形式としては中途半端です。

変換の手順は次の通りです。
-
[ツール]メニューの[ファイル変換:LBE 形式へ]-[PDIC テキスト形式から]を
クリックするとファイル変換ダイアローグが現れる(右図)。
-
「ソース・ファイル・パス」と「ターゲット・ファイル・パス」を指定する。
それぞれの欄の右にある[...]ボタンをクリックして、ファイルを選択するとよい。
-
各フィールドについて[文字セット]を指定する。
-
[変換]ボタンをクリックする。
-
変換の進行を示すグラフが 100% に達したら、[OK]ボタンをクリックする。
PDIC 一行テキスト形式の辞書を LBE 形式に変換する
PDIC 一行テキスト形式 は PDIC 辞書の保存形式の一つです。
利用される頻度は多くありません。
PDIC テキスト形式と同様に、LBE 形式への変換でエラーは生じませんが、
発音記号およびレベルのデータが保存されません。
変換の手順は PDIC テキスト形式の場合と同じです。
ただし、[変換]ボタンをクリックする前に
ラジオボタン[一行テキスト形式]をチェックしてください。
トラブルシューティング
PDIC の CSV 形式のデータから LBE 形式への変換途中でエラーが発生する
この問題は次のような条件が重なったときに生じる可能性のあることがわかっています。
- オリジナルの PDIC 辞書データの全部または一部が Shift JIS 以外の文字コードで書かれている。
- Shift JIS 以外の文字コードで書かれた部分に閉じられていないダブルクオート('"')がある。
例えば、ギリシャ語の辞典の中に次のような文字列が存在すると、エラーが発生する可能性があります。
"λεξικό
PDIC 形式から CSV 形式に変換する前に、
ダブルクオートの直前に空白文字を挿入すれば、エラーの発生は防止できます。
この問題は、PDIC が辞書データ CSV 形式への変換を行う際に、
辞書データの文字コードが Shift JIS であるとの前提に立っていることに起因しています。
以下の説明では Shift JIS の 1 バイト目にあたる 0x81 ~ 0x9f および 0xe0 ~ 0xfc の範囲の文字を、
記号 F で表すことにします。
PDIC は、一般的な CSV の規則に従って、データ中のダブルクオート(")をすべて二重の
ダブルクオートで置き換えていますが、F の次のダブルクオート(")については置き換えません。
他方、あるフィールドの値が F で終了している場合、PDIC は F の次にフィールドの終末を示す
ダブルクオートを置きます。
このため、F の次のダブルクオートが、ダブルクオートそのものであるのか、
フィールドの終末を示すのかを確実に判断することはできません。
そこで、LBE は F の直後のダブルクオートについて、それが同一のフィールド内の奇数番目の
ダブルクオートであれば文字列の終末を、偶数番目のダブルクオートであれば、
ダブルクオートそのものを表すと判定しています。
この規則は PDIC の CSV を LBE に変換する場合にのみ、適用されます。
(C) 黒田努 <tkrd@mail.com> (2002-09-03) (2003-03-10)