公募研究
- 研究課題:「デジタル音声言語コーパスによる危機言語資料保存利用方法の研究開発」
- 研究代表者:土屋 俊
千葉大学地図課題コーパスについて
- 研究開始への経緯を説明
- エジンバラでの先行研究 (HRC) との比較
- 実際のデータ収録場面をビデオで見て,自然な会話が行われていることを確認
- 地図課題コーパスでこれまでに収集されたデータの説明
- データフォーマットの解説 (TEI (Text Encoding Initiative) の 標準 DTD フラグメントの組み合わせで転記できる)
- 転記作業の実際を,日本語,およびモンゴル語のデータを使って紹介
音声→ダウンサンプリング→時間スケルトンファイルの作成→支援ツールを使った転記→結果のブラウズ
地図課題コーパスのツールの危機言語研究への応用
- フィールドでの音声収録機器に対する提案
- DAT や DV を使う
- マイクロフォンにお金をかけて、志向性の強いものにする。
- 危機言語研究に期待すること:
- 地図課題コーパスのデータの増強:会話資料収集のきっかけにする。
- さまざまな音声データを提供してもらい,利用できる音声データの基準をはかる
本年度の研究計画
- ツールの高速化、整備の完了 (Tcl/tk はプロトタイピングであり,Windows 用に特化したツールを開発)
- ノイズ除去の理論的検討の完了
- インストーラ付きでツール配布する
- ツール利用説明会を行う