日本語のコーパス
◇国立国語研究所 (国立国語研究所・情報通信研究機構・東京工業大学が共同開発したコーパス)
- 『日本語話し言葉コーパス』公開のご案内
- 『日本語話し言葉コーパス』の概要と予備的分析結果 (予備的分析の他に、研究用情報の付与などをまとめている。)
- 既に判明している問題点 (種々の誤植やデータの問題点などが挙げられている。)
◇小学館コーパスネットワーク
- 小学館コーパスネットワーク[SCN] (口語・専門語・学習者コーパスなど、英語にとどまらず、多言語コーパスも利用できる。)
- 検索ソフト"SAKURA"について (検索専用ソフトで、大規模コーパスを扱うものとしては現在世界で最も高性能なプログラムの1つ。)
◇学習者コーパス
- SSTコーパス (アルクより。スピーキングテストを対象データとして利用。)
- インタビュー形式による日本語データベース (北九州市立大学が開始した日本語母国語話者と非母国語話者の分析と言語データベース構築を目的としたもの。)
- 就労ブラジル人の発話文字化資料 (Nagoya University Japanese Corpus Project)
- 日本語研修生追跡データ (Nagoya University Japanese Corpus Project)
