PCによる外国語処理のためのリンク集

目次

第7回
「外国語ウェブページの作成 (1)」
第8回
「外国語ウェブページの作成 (2)」
第9回
「外国語で電子メール」
第10回
「改行コードとテキストエディタ」 [UP]
第11回
「ユニコード (1)」
第12回
「ユニコード (2)」
第13回
「まとめ;並べ替え (ソート)」

第7回「外国語ウェブページの作成 (1)」

HTML 4.01 仕様書 (Specification)
http://www.w3.org/TR/html4/
HTML 文法チェッカー
Another HTML-lint gateway (簡易ゲートウエイ) 目視では気づきにくいHTMLの文法エラーを自動診断してくれる,HTML文法チェッカー。大変便利なので,自分のHTML文書のソースのチェックに大いに利用しよう。慣れてきたら,より細かいチェックのできるページも利用してみよう。
HTML タグ解説
「初めてのHTML」 by 高辻先生 (国際経済学部)。他にも,参考になるウェブページは無数にある。活用しよう!

第8回「外国語ウェブページの作成 (2)」

ISO 639
"Code for the representation of names of languages" ISO (国際標準化機構, International Organization for Standardization) によって策定された言語名のコード表記の規格。1988年に策定され,130余りの言語のコードをASCII 2文字で表記している。HTMLの lang 属性とともによく用いられる。
ISO 3166
"Codes for the representation of names of countries" 国や地域名をASCIIのコードで表記する方法。表記方法には,国名表記,アルファベット表記(2文字および3文字),数値表記がある。
ISO 639-2 Registration Authority
"Codes for the representation of names of languages. Part 2: alpha-3 code." 米国議会図書館 (The Library of Congress) の運営する ISO 639 の新バージョン ISO 639-2 の公式ホームページ。1988年に策定された旧バージョン (ISO639-2 策定にあわせ ISO639-1 と名称変更した) はコードが130余りと絶対的に不足していたため,言語名を ASCII 3文字で表記し,400あまりの言語を表記できる新たなコード体系を新たに規定した。コード一覧には旧バージョンとの対応関係も示されている。

第9回「外国語で電子メール」

Hotmail トップページ
ブラウザの「言語」の設定に合わせて表示言語が変わる。Hotmail 情報 などを参考に,その特徴をつかんで上手に利用しよう。
Multipurpose Internet Mail Extensions (MIME)
IETF (Internet Engineering Task Force) による規格書 (技術者向け)。
MIME (Multimedia Internet Mail Extensions) Media Types [Content-Type で指定されるメディアの種類のリスト]
ftp://ftp.isi.edu/in-notes/iana/assignments/media-types/media-types
MIME Character Sets [MIME の Content-Type で指定される文字コード名のリスト]
http://www.iana.org/assignments/character-sets

第10回「改行コード,テキストエディタ」 [UP]

xyzzy 多言語対応テキストエディタ
亀井哲弥さん作のフリーウエア。公式マニュアルは決して親切ではないので,熱心なユーザによるページ,例えば Toy's xyzzy memo などが参考になるだろう。また,活発なメーリングリストがあるので,加入して情報を交換することもできる。(公式?) ダウンロードページにも,いくつか活用例を紹介したページへのリンクがある。
[追加コメント] xyzzyは多機能なエディタであり,カスタマイズも自在であるが,一般的なWindowsアプリケーションとは異なる設計思想をもつ emacs というエディタを元にしているので,少々使いづらいと感じられるかもしれない。また,多言語編集環境として不足はないものの,ソフトウエア自体は内部でUnicodeを使っていないので,いわゆる「Unicodeアプリケーション」(第12回で解説予定) とはいえない。そのため,ユーザ側が基本的にエンコード方式を逐一指定してやらなければならない (メニューから検索文字に外国語テキストを入力できないことや,Unicodeアプリケーションとの間のコピー&ペーストの際に問題が起こることは何とも残念。解決の方法はあるが,よほど xyzzzy や emacs を使い込んだ人でないととっつきにくい)。
窓の森 エディターライブラリ
Windowsには,フリーで使えるテキストエディタや,利用料を払って使うシェアウエアのエディタなど,多くのエディタがある。PCを持っている人は試してみるとよい。xyzzyも登録されている「窓の森」には,多くのソフトがライブラリ化されている。
  • EmEditor はシェアウエアだが,現在最も質の高いテキストエディタ。Unicodeにも完全対応し,多言語編集には最適である。ダウンロードして,試用もできる。最近パッケージ版が発売され,購入しやすくなった。定価5,500円で,7月15日まで図書券キャッシュバック優待キャンペーン中らしい。

第11回「ユニコード (1)」

Unicode の基本文献
  • The Unicode Consortium (2000) The Unicode Standard Version 3.0 (with CD-ROM) Reading, MA: Addison-Wesley. Unicode 標準の規格書。現在出版されている一番新しいもの (最新の規格は 3.2 にマイナーバージョンアップしている)。
  • トニー・グラハム著 (乾 和志 & 海老塚 徹訳; 関口 正裕監修) (2001) 『Unicode 標準入門』 翔泳社.3,800円 関連規格である ISO/IEC 10646 や,Unicode のサポート状況などに関する情報を含め,非常に詳細に Unicode の規格を解説。
  • ユニコード漢字情報辞典編集委員会編 (2000) 『ユニコード漢字情報辞典』三省堂.5,000円 初めて出版されたユニコード漢字辞典。Unicode のほか,日本語,簡体字中国語,繁体字中国語 (BIG5ではない...),韓国語のローカルな文字コードが対照できる貴重な辞典。索引が引きにくいのが玉にだが,漢字圏の言語のテキストを頻繁に扱う人はぜひ利用したい。
The Unicode Standard: A Technical Introduction
Unicord Consortium による Unicode の紹介 (英語)。Unicode の仕様書は大変技術てきで読みにくいので,ここらあたりからはじめてはいかが。

第12回「ユニコード (2)」

Unicode Transcriptions
いろいろな文字で「Unicode」を表記した多言語混在テキストのサンプルページ。
UTF-8 Sampler
さまざまな言語のテキストサンプルを収録した UTF-8 のサンプルページ。
Unicode Code Charts (PDF Version)
Unicode コンソーシアムのリソース。収録されている文字のリストを文字の種類ごとにみることができる。
Unicode Character Name Index (PDF Version)
Unicode コンソーシアムのリソース。収録されている文字に付けられた名前のリスト。Windows2000の「文字コード表」で検索に利用できる。

第13回「まとめ;並べ替え (ソート)」

RTF コンバータ
針谷壮一先生作のフリーウエア。漢字圏のテキストの相互変換を含めて,60以上の文字コードにも及ぶテキスト・RTFファイルのコード変換を行える変換ツール。大学のパソコンにもインストールされている。
授業トップページに戻る
授業資料のページに戻る

first created: 2002/04/11; last updated 2002/07/19;
2002 © CHIBA Shoju, all rights reserved.
e-mail: schiba@reitaku-u.ac.jp