SIL to Unicode IPA Font Converter Version 1.0 について 千葉 庄寿 (ちば しょうじゅ, CHIBA Shoju) 麗澤大学外国語学部 (College of Foreign Languages, Reitaku University) e-mail: schiba@reitaku-u.ac.jp Note: This file is encoded with UTF-8. このファイルは UTF-8 でエンコ ードされています。 =======目次======  ・この文書の更新履歴  ・概要  ・History  ・開発・動作環境  ・インストール方法  ・アンインストール方法  ・最新情報の入手  ・現バージョンでの動作制限と今後の開発予定  ・利用上の注意  ・謝辞 ======= 【この文書の更新履歴】 2003/03/03 初版作成 (2003/03/08 更新) 【概要】 SIL Encore IPA フォント (SIL IPA93 Fonts 2.0, SIL Doulos IPA93, SIL Sophia IPA93, SIL Manuscript IPA93, 以下 SIL フォント) を使って作成さ れた RichText Format 文書 (RTF 文書) を Unicode テキスト (テキスト文書) に変換します。(現バージョンは SIL IPA Fonts 1.2 には対応していません。) SIL フォント (URI: http://www.sil.org/computing/fonts/encore-ipa.html) は公開以来,多くの言語学関連資料で使われてきましたが,8ビッ ト環境で小文字のアルファベット以外の文字・記号を IPA の記号に割り当て ています。そのため,ワードプロセッサ上では他のフォントを使ったテキスト と共存できても,テキストファイルではフォントを切り替えることができない ため,せっかくの IPA による転写が使い物になりません。例えば,英語 linguist の標準的な発音を SIL フォントを使って IPA 表記したテキストをテキストファイ ルとして保存すると, ÈlINgwIst というふうに,IPA の一部が別の文字になってしまいます。 また,International Phonetic Association のホームページにある "IPA Symbols, Unicode and the Web" URI: http://www2.arts.gla.ac.uk/IPA/ipahtml.html で述べられている通り,SIL フォントは HTML では安全に使うことができませ ん (フォントがテキストフォントでなく,記号フォントであるため,WWWブラ ウザによってはフォント名を指定しても表示できません)。 SIL to Unicode IPA Font Converter は,フォント情報を保持した RTF フォ ントから,SIL フォントが適用された文字列について文字コードを対応する Unicode に変換し,Unicode テキストを作成します。例えば,上記の SIL の 例は ˈlɪŋɡwɪst という Unicode 文字列に変換されます (日本語フォントでは一部文字化けし ますが,Arial Unicode MS などの適切な文字フォントをもつ Unicode フォン トで表示すると正しい記号で表示されます)。 変換先の Unicode テキストは,Unicode の変換形式である UTF-8, UTF-16, UTF-16 big endian のいずれかの形式で保存できます。ファイルの先頭 には Unicode の変換形式を表示した Byte Order Mark (BOM) がつくので, Unicode 対応アプリケーションであれば,変換形式を自動認識できます。 【History】 2003/03/03 バージョン 1.0 公開 【開発・動作環境】 SIL to Unicode IPA Font Converter は Microsoft Visual C# .NET で開発 し,Windows2000 Professional Service Pack3 (CPU Pentium III 600Mhz, Memory 398MB), および Windows XP Professional Edition Service Pack 1 (CPU 1.0GHz, Memory 768MB) 上で動作を確認しています。 SIL to Unicode IPA Font Converter の実行には Microsoft .NET Framework 1.0 の実行環境が必要です。.NET Framework は Windows 98, ME, NT, 2000, XP (Home & Professional) の各バージョンで利用できますが,Windows 95 お よびそれ以前のバージョンでは利用できません。.NET Framework のインストー ルファイルは,以下の URI から無償でダウンロードできます: 日本語: http://www.microsoft.com/japan/msdn/netframework/prodinfo/getdotnet.asp 英語: http://msdn.microsoft.com/netframework/downloads/howtoget.asp (上記 URI には実費で CD-ROM を入手するための情報もあります。)「.NET Framework 再頒布パッケージ」(ファイル名 dotnetredist.exe, 20.4MB) をダウンロードして実行すると.NET Framework をインストールするためのプ ログラムファイル dotnetfx.exe が生成されますので,dotnetfx.exe をダブ ルクリックしてインストールしてください。 なお,.NET Framework 1.0 の不具合やセキュリティーの更新をおこなう Service Pack 2 (5.9MB) がリリースされていますので,.NET Framework のインストール後にイ ンストールしておくことをおすすめします。以下の URI からダウンロードで きます: 日本語: http://www.microsoft.com/japan/msdn/netframework/downloads/sp2/download.asp 英語: http://msdn.microsoft.com/netframework/downloads/updates/sp/default.asp .NET Framework の Service Pack は,Microsoft が提供しているオンライン サービス Windows Update (URI: http://windowsupdate. microsoft.com/) を 使ってもインストールできます。 【重要】Windows 98, ME では動作を確認していません。SIL to Unicode IPA Font Converter は多数の特殊な Unicode 文字を処理するアプリケーションで すので,Unicode の処理方式の異なる Windows 98 および Windows ME では, 表示その他挙動がおかしくなる可能性があります。 【インストール方法】 1. Microsoft .NET Framework をインストールします (【動作環境】を参照して ください)。 2. 自己解凍式のZIPアーカイブ SILconv.exe をダウンロードします。 3. アーカイブをダブルクリックし,解凍先のフォルダを指定します。 4. 解凍が完了すると,解凍先のフォルダに3種類のファイルが置かれます。 SIL2Unicode.exe ...実行ファイル SIL2Unicode.txt ...このファイル readme.txt ... 簡単なレジュメ SIL2Unicode.exe をダブルクリックするとアプリケーションが起動します。 【アンインストール方法】 レジストリは使用しておりませんので,実行ファイル SIL2Unicode.exe を削 除するだけでアンインストールが完了します。 【最新情報の入手】 SIL to Unicode IPA Font Converter の最新情報および最新の実行ファイルを 含む自己解凍式ファイルは http://www.fl.reitaku-u.ac.jp/~schiba/tools/ で入手できます。 【現バージョンでの動作制限と今後の開発予定】 ・現バージョン (1.0) では,RTF から RTF の変換はできません。これは,開発  中のバージョンで実装している RTF 出力にバグがあるためで,解決できれば  以後のバージョンに導入したいと思います。なお,現在 SIL で開発中の  Unicode 対応 IPA フォントが安定バージョンとして公開された時には,  SIL Doulos, Sophia, Manuscript の各 IPA フォントを対応する Unicode  フォントに変換した RTF 文書を作成できるよう,ぜひ機能を拡張したいと  思っています。 ・Microsoft Excel ファイルを直接変換することはできません。Excel のファイル  の内容に SIL フォントが使われている場合には,内容を Word などワードプロ  セッサに貼り付けて RTF で保存し,その変換結果を再度ワードプロセッサ経由  で Excel に貼り付ける,などの工夫をする必要があります (Word, Excel とも,  バージョン 2000, 2002 (Office XP) であれば Unicdode のコピーや貼り付  けを安定して行うことができます)。 ・SIL IPA93 Fonts 2.0 のみに対応しています。バージョン 1.2 の古いフォントには現在のところ対応していません。 ・出力先 Unicode ファイルには自動的に BOM (Byte Order Mark) がつきます。  BOM は UTF-16 と UTF-16be を区別するためには必ず必要ですが,UTF-8 に  は必ずしも必要ありません。BOM なしの UTF-8 ファイルを作成したい場合に  はテキストエディタ等,他のツールでBOMを除去してください。 ・SIL フォントに含まれる IPA 記号と Unicode の IPA 記号のコード番号は,一  対一には対応していません。本ソフトウエアの開発にあたっては,以下のリソー  スに基づいて,SIL フォントと Unicode のコード値をマッピングしています。   1. SIL Encore Font のパッケージに含まれるドキュメント Ipa93.doc   2. ``Appendix 2: Computer Coding of IPA Symbols,'' International    Phonetic Assiciation (1999) Handbook of the International Phonetic    Association: A Guide to the Use of International Phonetic Alphabet.    Cambridge: Cambridge University Press. pp. 161--185.  このため,変換前と変換後の記号には以下のような相違が発生します。   1. Unicode では SIL フォントで区別されている高さと幅の異なる補助記号    は区別されていません (全て同じ記号として扱われます)。例えば Double    Acute Accent (IPA の Extra high level [tone/accent]) は,o の幅    と i の幅ごとに2段階の高さで合計4種類用意されていますが,SIL to    Unicode IPA Font Converter ではこれらの文字は上記 Ipa93.doc のマッ    ピングに合わせ,全て同一のコードに変換されます。   2. SIL フォントにあって Unicode にない文字については,角括弧で [文字の    種類と説明] という形の代替テキストに変換されます。以下に代替テキス    トの内容をリストします。 A. 対応する表記が IPA に存在しない。 SILコード 代替テキスト 190 [Dotless J: IPA N/A] 201 [Superior m: IPA N/A] 212 [Superscript Eng: IPA N/A] 203 [Superscript left-tail N (at left): IPA N/A] 133 [Right Bar 53: IPA N/A] 217 [Right Bar 31: IPA N/A] B. Ipa93.doc には対応する IPA 番号がないが,Handbook of the International  Phonetic Association のリストには対応する IPA 番号がある。ただし,  Unicode のコード値が存在しない。 SILコード 代替テキスト 232 [Right Bar 15: IPA 529, Unicode N/A] 134 [Right Bar 51: IPA 530, Unicode N/A] 216 [Right Bar 35: IPA 531, Unicode N/A] 128 [Right Bar 13: IPA 532, Unicode N/A]   3. また,一部のフォントは独自のコード値に変換します。以下に代替コ    ードの内容をリストします。 C. Ipa93.doc には対応する IPA 番号がないが,対応する Unicode 文字が存  在する。 SILコード 代替コード値 (説明) 202 0x00A0 (Minute Space → No-Break Space) 92 0x005C (Backward Slash → Reverse Solidus) 47 0x002F (Forward Slash → Solidus) 214 0x002D (Hyphen Dash → Hyphen-Minus) 174 0x026A + 0x02D7 (Undotted Barred I → IPA No. 319 + 494) 【利用上の注意】 SIL to Unicode IPA Font Converter はフリーソフトです。このソフトウエア の再配布は自由に行ってかまいませんが,その際は実行ファイルとともに, 同包されているファイル (SIL2Unicode.txt [このファイル] を含む) を一緒に 配布してください。なお,最新のバージョンをホームページ  URI: http://www.fl.reitaku-u.ac.jp/~schiba/tools/ からダウンロードして利用することをおすすめします。 ソフトウエアの著作権は千葉庄寿 (ちばしょうじゅ) にあります。ソフトウエ アの不具合や,このドキュメントの間違いなどを発見されましたら,制作者 千葉 (e-mail: schiba@reitaku-u.ac.jp) までお知らせいただけると幸いです。 なお,SIL to Unicode IPA Font Converter を利用したことにより発生した損 害への責任は一切負いかねますのでご了承ください。 【謝辞】 このソフトウエア (SIL to Unicode IPA Font Converter Version 1.0) は文部 省科学研究費補助金 特定領域研究(A) 「環太平洋の『消滅に瀕した言語』に かんする緊急調査研究」 計画研究「情報処理による調査研究支援」 (課題番 号 12039213; 研究代表者 松村一登 (東京大学大学院人文社会系研究科)) の 研究成果の一環として開発されました。記して感謝いたします。