調整班B03
コーパスへの文法情報の付加(タグ付け)
[ 目次に戻る ]
- テキストに段落,文の境界を明示する程度なら,どんな言語についても可能
それより先の情報をテキストに付加する可能性についての研究の必要性
- 文法的な情報の付加
- 文法タグ付加(markup)の自動化
- いわゆる lemmatizer/POS tagger の活用(すでに利用)
- 文に統語構造を与えるプログラムの活用(未開拓)
- disambiguation の問題にどう対処するか
コーパスの利用(検索)
- コーパスは実際に自分で利用できなければ作っても意味がない
たいていの場合,KWIC索引ができる程度で研究には十分役立つ
- テキストのみの場合:
GREP + SORT で間にあうかも。市販のソフトも利用可。
- より複雑な付加情報を表すタグがついたコーパスの場合:
ある程度汎用になるプログラムの開発が必要
- Perl スクリプト(すでに利用)
- 全文検索システムの利用の可能性(開拓中)
[ 目次に戻る ]