This page is encoded using Unicode UTF-8 | このページは UTF-8 でエンコードされています

ツールとソフトウエアのページ

千葉が開発したテキストデータ処理用ツールを公開しています。

Last Updated: 2004-01-09
千葉のトップページに戻る

公開ツール一覧

言語コーパス構築のためのツールボックス

言語データを Unicode テキストとして電子化し,コーパスとして利用するためのツール群です。フィールドワークで収集した言語データへの利用を想定し,音声記号入りテキストの作成や,テキストの検索を支援する目的で作成しました。また,XML を使ってコーパスを構造化するためのツールのプロトタイプも含まれています。

ツールは全てフリーウエアです。再配布も自由ですが,このページの URL から最新のバージョンを入手していただくのがよいかと思います。

ツールの著作権は制作者 千葉庄寿 (ちばしょうじゅ) にあります。ソフトウエアの不具合や,このドキュメントの間違いなどを発見されましたら,制作者 (e-mail: schiba@reitaku-u.ac.jp) までお知らせいただけると幸いです。なお,ツールを利用したことにより発生した損害への責任は一切負いかねますのでご了承ください。

ツールは文部省科学研究費補助金 特定領域研究(A) 「環太平洋の『消滅に瀕した言語』にかんする緊急調査研究」 計画研究「情報処理による調査研究支援」 (課題番号 12039213; 研究代表者 松村一登 (東京大学大学院人文社会系研究科)) の研究成果の一環として開発されました。ここに記して感謝いたします。

全ツールの一括ダウンロード

利用の際は動作環境およびインストール・アンインストール方法を確認してください。

各ツールの説明およびツールの個別ダウンロード

ツール名Ver.簡単な説明Download解説
Unicode-based IPA String Editor
[ 画面ショット ]
1.0IPA (International Phonetic Alphabet) を含む Unicode テキストを作成する際に,IPA のテキストの入力を補助するソフトウエアキーボード です。[ 自己解凍式 ZIP ]
[ ZIP アーカイブ ]
[ HTML ]
[ TEXT ]
SIL to Unicode IPA Font Converter
[ 画面ショット ]
1.0SIL IPA93 Fonts 2.0 (SIL Doulos IPA93, SIL Sophia IPA93, SIL Manuscript IPA93) を使って作成された RTF 文書を Unicode テキストに変換します。[ 自己解凍式 ZIP ]
[ ZIP アーカイブ ]
[ HTML ]
[ TEXT ]
UniGrep: Unicode-compliant Grep
[ 画面ショット ]
1.1Unicode (UTF-8, UTF-16, UTF-16 big endian) で作成されたテキストファイルについて検索を行い,マッチした行を抽出します。[ 自己解凍式 ZIP ]
[ ZIP アーカイブ ]
[ HTML ]
[ TEXT ]
XML Converter for Tab-separated Text
[ 画面ショット ]
1.0.1タブ Tab で区切られた Unicode テキストファイルから XML で構造化されたデータを生成します (汎用ではありません。特定のデータ構造のみ出力できます)。[ 自己解凍式 ZIP ]
[ ZIP アーカイブ ]
[ HTML ]
[ TEXT ]
Simple XML Data Viewer for Field Linguists
[ 画面ショット ]
0.1XML Converter for Tab-separated Text のサポートするデータ構造をもつ XML データを閲覧・検索します。通常のテキスト検索のほか,検索対象のデータの種類 (タグや属性,データの場所など) を絞った検索をおこない,マッチした単語を含む文を表示します。安定版ではありません。バグが残っていますので利用の際はご注意下さい。[ 自己解凍式 ZIP ]
[ ZIP アーカイブ ]
[ HTML ]
[ TEXT ]

動作環境

各ツールは Microsoft Visual C# .NET で開発し,Windows2000 Professional Service Pack3 (CPU Pentium III 600Mhz, Memory 398MB), および Windows XP Professional Edition Service Pack 1 (CPU 1.0GHz, Memory 768MB) 上で動作を確認しています。

【重要】 Windows 98, ME では動作を保障しません。特殊な記号を含む Unicode 文字を表示・処理するアプリケーションですので,Unicode の処理方式の異なる Windows 98 および Windows ME では表示その他の挙動がおかしくなるようです。

IPA String Editor の実行には Microsoft .NET Framework 1.0a の実行環境が必要です。(1.0a はバージョン1.0のセキュリティーを高めたバージョンです。) .NET Framework のインストールファイル「.NET Framework 再頒布パッケージ」(ファイル名 dotnetredist.exe, 20.4MB) は,Microsoft のホームページ (日本語 | 英語) から無償でダウンロードできます (実費で CD-ROM を入手することもできます)。

.NET Framework Version 1.1 再頒布可能パッケージ (日本語 | 英語) での動作は保障しません。できるだけ1.0をご利用ください。.NET Framework 1.0 は 1.1 が既にインストールされている環境でも安全にインストールすることができ,共存可能です。

「.NET Framework 再頒布パッケージ」をダウンロードして実行すると .NET Framework をインストールするためのプログラムファイル dotnetfx.exe が生成されますので,dotnetfx.exe をダブルクリックしてインストールしてください。

なお,.NET Framework 1.0 の不具合やセキュリティーの更新をおこなう Service Pack 2 (5.9MB) がリリースされていますので,.NET Framework のインストール後にインストールしておくことをおすすめします。

.NET Framework の Service Pack は,Microsoft が提供しているオンライン サービス Windows Update (URI: http://windowsupdate.microsoft.com/) を 使ってもインストールできます。

インストールとアンインストール

以下は自己解凍式の ZIP ファイルを利用したインストール方法です (ZIP アーカイブの解凍ツールをお持ちの方は,ZIP アーカイブを直接解凍することもできます)。

  1. Microsoft .NET Framework をインストールします (動作環境を参照してください)。
  2. 自己解凍式の ZIP ファイルをダウンロードします。
  3. アーカイブをダブルクリックし,解凍先のフォルダを指定します。
  4. 解凍が完了すると,解凍先のフォルダに実行ファイルを含むファイルが置かれます。
  5. マニュアルを参照し,実行ファイルをダブルクリックしてアプリケーションを起動します。

アンインストールは実行ファイルを削除するだけです (レジストリは使用しておりません)。

お問い合わせは schiba@reitaku-u.ac.jp までどうぞ [もっと詳しく]

First Created: 2003-03-21;
Last Updated: 2004-01-09;
2003-2004 © CHIBA Shoju;
e-mail: schiba@reitaku-u.ac.jp