プロジェクト概要
「言語研究のための多言語データベースの構築」プロジェクトホームページへようこそ!
電子化された言語テキスト(「言語コーパス」)を用いた言語研究は,近年,情報技術の発達とともに急速に脚光を浴びており,英語研究においては既に一定の成果を得るに至っています。しかし,日本語をはじめとする英語以外の言語においては,コーパスを用いた研究の手法はいまだ未成熟で,コーパスの利用は工学系のいわゆる「自然言語処理」にとどまり,純粋な言語研究,言語教育からのコーパスの利用環境は整っているとは言えません。この原因は,コーパス自体の構築が進んでいないことに加え,言語学的な分析に必要な検索・統計処理機能を備えた多言語コーパスの利用環境が存在せず,さらに研究に情報処理技術を活用するために前提となる知識基盤が整理されていないこと,言語研究者がそれらの知識を習得し活用するための支援体制が整備されていないことが原因だと考えられます。
本プロジェクト「言語研究のための多言語データベースの構築」は,情報処理を利用した言語研究のための環境整備をおこなうとともに,多言語コーパスの構築技術の確立と,多言語に対応し,言語研究に特化した高度な分析機能をもつデータベースシステムの開発・運用をめざす観点から,メンバーは以下の部門に分かれて研究活動を行います。
- コーパス班:
- コーパス検索用サーバの運営
- オンラインコーパスサービスの設計と運用
- コーパスデータの収集,ソフトウエアの情報収集
- コーパスを用いた言語研究の推進
- サブプロジェクト「『捷解新語』データベースのUnicode化」班:
- 中期朝鮮語文献のUnicode化とオンラインデータベース化
- 朝鮮語テキストの情報処理に関する情報の収集とマニュアル化
- サブプロジェクト「日本語古典文法書の電子化」班:
- 日本語国文法の主要文献の電子化と横断検索の実現
- 国文法の専門用語のデータベースの構築
- デジタル文書体制の整備とノウハウの蓄積
また,教育基盤の整備のため,情報処理関連の情報と知識を蓄積し学内外に提供するための活動を実施するとともに,ウェブページで積極的に情報を公開していきます。

