言語研究センター第1回ワークショップ (言語情報学) 「日本語コーパス研究のための『茶筌』入門」
終了しました
ワークショップ概要
日本語は,分かち書きがおこなわれないため,単語の認定と分類をおこなうための充分な手がかりがありません。形態素解析システム「茶筌」をはじめとする形態素解析ツールは,単語(形態素)の分割,基本形や品詞,活用情報の提示といった,コーパスに基づいた日本語研究を行ううえで重要な情報を提供してくれる有用なツールです。解析データに基づき,私たちは統計情報を取得したり,基本形や文法情報を踏まえた検索をおこなったりすることができます。
本ワークショップでは,日本語の形態素解析ツールとして最も広く普及している「茶筌」の開発者である松本先生に,日本語研究に「茶筌」の解析の仕組みを正しく理解し,また解析結果を効果的に利用するための基礎知識を解説していただきます。
また,「茶筌」を使って用例を検索・分析する際の具体的な問題点や注意点のディスカッションを通じ,形態素解析の結果を日本語研究に適切に応用するための情報交換の場を設けたいと思います。
本ワークショップは,コーパスを研究データとして利用したいと考えている日本語研究者や学生をひろく対象としています。形態解析されたコーパスや,形態素解析システム「茶筌」を利用した経験のある方でなくとも,日本語研究とコーパスに関心のある方ならばどなたでもご参加いただけます。
