PCによる外国語処理のためのリンク集
目次
- ISO 639
- "Code for the representation of names of languages" ISO (国際標準化機構, International Organization for Standardization) によって策定された言語名のコード表記の規格。1988年に策定され,130余りの言語のコードをASCII 2文字で表記している。HTMLの lang 属性とともによく用いられる。
- ISO 3166
- "Codes for the representation of names of countries" 国や地域名をASCIIのコードで表記する方法。表記方法には,国名表記,アルファベット表記(2文字および3文字),数値表記がある。
- ISO 639-2 Registration Authority
- "Codes for the representation of names of languages. Part 2: alpha-3 code." 米国議会図書館 (The Library of Congress) の運営する ISO 639 の新バージョン ISO 639-2 の公式ホームページ。1988年に策定された旧バージョン (ISO639-2 策定にあわせ ISO639-1 と名称変更した) はコードが130余りと絶対的に不足していたため,言語名を ASCII 3文字で表記し,400あまりの言語を表記できる新たなコード体系を新たに規定した。コード一覧には旧バージョンとの対応関係も示されている。
- Hotmail トップページ
- ブラウザの「言語」の設定に合わせて表示言語が変わる。Hotmail 情報 などを参考に,その特徴をつかんで上手に利用しよう。
- Multipurpose Internet Mail Extensions (MIME)
-
- IETF (Internet Engineering Task Force) による規格書 (技術者向け)。
- MIME (Multimedia Internet Mail Extensions) Media Types [Content-Type で指定されるメディアの種類のリスト]
- ftp://ftp.isi.edu/in-notes/iana/assignments/media-types/media-types
- MIME Character Sets [MIME の Content-Type で指定される文字コード名のリスト]
- http://www.iana.org/assignments/character-sets
- xyzzy 多言語対応テキストエディタ
- 亀井哲弥さん作のフリーウエア。公式マニュアルは決して親切ではないので,熱心なユーザによるページ,例えば Toy's xyzzy memo などが参考になるだろう。また,活発なメーリングリストがあるので,加入して情報を交換することもできる。(公式?) ダウンロードページにも,いくつか活用例を紹介したページへのリンクがある。
[追加コメント] xyzzyは多機能なエディタであり,カスタマイズも自在であるが,一般的なWindowsアプリケーションとは異なる設計思想をもつ emacs というエディタを元にしているので,少々使いづらいと感じられるかもしれない。また,多言語編集環境として不足はないものの,ソフトウエア自体は内部でUnicodeを使っていないので,いわゆる「Unicodeアプリケーション」(第12回で解説予定) とはいえない。そのため,ユーザ側が基本的にエンコード方式を逐一指定してやらなければならない (メニューから検索文字に外国語テキストを入力できないことや,Unicodeアプリケーションとの間のコピー&ペーストの際に問題が起こることは何とも残念。解決の方法はあるが,よほど xyzzzy や emacs を使い込んだ人でないととっつきにくい)。
- 窓の森 エディターライブラリ
- Windowsには,フリーで使えるテキストエディタや,利用料を払って使うシェアウエアのエディタなど,多くのエディタがある。PCを持っている人は試してみるとよい。xyzzyも登録されている「窓の森」には,多くのソフトがライブラリ化されている。
- EmEditor はシェアウエアだが,現在最も質の高いテキストエディタ。Unicodeにも完全対応し,多言語編集には最適である。ダウンロードして,試用もできる。最近パッケージ版が発売され,購入しやすくなった。定価5,500円で,7月15日まで図書券キャッシュバック優待キャンペーン中らしい。
- Unicode の基本文献
- The Unicode Consortium (2000) The Unicode Standard Version 3.0 (with CD-ROM) Reading, MA: Addison-Wesley.
Unicode 標準の規格書。現在出版されている一番新しいもの (最新の規格は 3.2 にマイナーバージョンアップしている)。
- トニー・グラハム著 (乾 和志 & 海老塚 徹訳; 関口 正裕監修) (2001) 『Unicode 標準入門』 翔泳社.3,800円
関連規格である ISO/IEC 10646 や,Unicode のサポート状況などに関する情報を含め,非常に詳細に Unicode の規格を解説。
- ユニコード漢字情報辞典編集委員会編 (2000) 『ユニコード漢字情報辞典』三省堂.5,000円
初めて出版されたユニコード漢字辞典。Unicode のほか,日本語,簡体字中国語,繁体字中国語 (BIG5ではない...),韓国語のローカルな文字コードが対照できる貴重な辞典。索引が引きにくいのが玉に瑕だが,漢字圏の言語のテキストを頻繁に扱う人はぜひ利用したい。
- The Unicode Standard: A Technical Introduction
- Unicord Consortium による Unicode の紹介 (英語)。Unicode の仕様書は大変技術てきで読みにくいので,ここらあたりからはじめてはいかが。
- RTF コンバータ
- 針谷壮一先生作のフリーウエア。漢字圏のテキストの相互変換を含めて,60以上の文字コードにも及ぶテキスト・RTFファイルのコード変換を行える変換ツール。大学のパソコンにもインストールされている。
first created: 2002/04/11; last updated 2002/07/19;
2002 © CHIBA Shoju, all rights reserved.
e-mail: schiba@reitaku-u.ac.jp