今日の一枚 千葉庄寿のページへようこそ

Last Updated: 2007-04-03
Japanese | English | Finnish
This page is encoded with utf-8.

インターネットを用いた用例検索のヒント

総合科目「ことばのワンダーランドへようこそ」
課題レポート (千葉担当分) の補足説明&ヒント

インターネットからの用例収集に関するヒントを以下に挙げます。レポート作成の参考にしてください。

Google の利用法 >> Google を開く

  • 検索結果の利用法: 検索結果には,そのページへのリンクとともに,そのページの該当部分の例文(の断片)が表示されます (キーワードが太字で表示されます)。また,「キャッシュ」を開くとキーワード部分が色分け表示され,大変便利です。
  • フレーズ検索: Google では,キーワードが自動的に分割されることがあります (例えば「麗澤大学」で検索した場合「麗澤」「大学」で検索した場合で検索結果の件数はまったく同じになります。「麗澤大学」が分割されて検索されることが分かります)。検索キーワードをより厳密に指定したい場合には,キーワードを " で囲みます ("麗澤大学" で検索すると," なしの時よりも検索件数がぐっと減ります)。
  • より多くの用例の閲覧: 「検索オプション」を開くと,検索結果の1回当たりの表示件数を100件まで増やすことができます。

Yahoo! ニュース用例検索 CGI の利用法 >> CGI を開く (学内のみ)

  • Yahoo! JAPAN のニュース記事 (日本語) を検索し,該当する用例を一覧表示する CGI です。学内でのみ利用可能です。
  • 検索キーワードは1つだけ指定できます。
  • 検索した用例をキーワードを中心に両側に25文字ずつ表示した KWIC (KeyWord In Context) という形式で表示します。出典元のページへのリンクも作成されます。
  • Yahoo! ニュース用例検索 CGI で「用例をテキストとして表示」オプションを使うと,テキストをタブ区切りの形で取り出し,さらに用例を見やすく加工することができます。詳細は以下を参照してください。

Yahoo! ニュース CGI の用例データをExcelで整理する (後件でソート) >> CGI を開く (学内のみ)

  • Yahoo! ニュース用例検索 CGI で「用例をテキストとして表示」オプションを使うと,テキストをタブ区切りの形で取り出し,さらに用例を見やすく加工することができます。タブは以下のパターンで入っています。
    例文番号 [TAB] URL [TAB] 前件 [TAB] キーワード [TAB] 後件
    タブをExcelのセルの区切りとして利用することで,用例を後件で上手にソートすることができます (前件の末尾でソートするのはさらにもう一工夫要ります)。以下にその方法を簡単に述べます。
    1. 「用例をテキストとして表示」を使ってテキストを表示させ,[編集]⇒[すべて選択]し,コピーします。
    2. Excelを起動し,A1セルにセルポインタを置きます。[編集]⇒[形式を選択して貼り付け]を選択して「テキスト」または「Unicodeテキスト」として貼り付けます。
    3. 「後件」にあたるE列でソートします ([データ]⇒[並べ替え])。これでキーワードの直後の文字できれいに用例が並べ替えられます。
    4. さらに,前件にあたるC列を「右揃え」にしてキーワードの直前のテキストが閲覧できるようにします。セルの幅を見やすいように整えます。

【応用】 Yahoo! ニュース CGI の用例データをExcelで整理する (前件でソート) >> CGI を開く (学内のみ)

  • 「用例をテキストとして表示」オプションで作成し,Excelにコピーしたデータは,そのままではキーワードの直前の単語でソートすることができません。これは,Excelが「文字列の後ろからソート」という機能を持っていないからなのですが,以下のようにして簡略的ながら前件でのソートをおこなうことができます。この方法は,特に前件の情報が重要になる動詞の意味の違いを分析する際に有効です。
    1. 「用例をテキストとして表示」を使ってテキストを表示させ,[編集]⇒[すべて選択]し,コピーします。
    2. Excelを起動し,A1セルにセルポインタを置きます。[編集]⇒[形式を選択して貼り付け]を選択して「テキスト」または「Unicodeテキスト」として貼り付けます。
    3. 前件にあたるC列を「右揃え」にしてキーワードの直前のテキストが閲覧できるようにします。セルの幅を見やすいように整えます。(ここまでは後件でのソートと同じです。)
    4. 「後件」にあたるE列の後に,前件からソート用の文字を取り出します。セルF1に以下のように式を入力してください。
      =MID(C1, LEN(C1), 1)
      F1の式をF2以下にオートフィルします。これで前件最後の1文字を取り出すことができます。関数MID, LENの意味と使い方についてはExcelのヘルプで調べてください。
    5. 必要ならば前件の後ろから2文字目,3文字目を同様に取り出しておきます (式はそれぞれ =MID(C1, LEN(C1) -1, 1)=MID(C1, LEN(C1) -2, 1)...のようになります)。
    6. いよいよソートです。F列以下のデータで前件の最後の文字から順番にソートします。(F, G, H ...の順番にソートを行うことになります。F, G, H セル中に数字が入っている場合,数字としてソートできない旨警告がでますが,そのままソートしてかまいません。)
    7. ソートができたら,後件のセル幅などを調整し,例文を見やすく調整します。

その他

  • 検索する語形に注意: 動詞や形容(動)詞の変化形はさまざまあります。探したい用例を網羅的に検索するためには,キーワードを何度かに分けて入力したり,複数の変化形を含むように入力するキーワードを工夫する必要があります。
  • 収集した用例の範囲に注意: 動詞や形容(動)詞は,さまざまなパターンで現れます。たとえば「美しい」は名詞の前に現れるパターンに加え,「~は美しい」というパターンでも使われます。もし,前者のみを考察の対象とする場合には,「後者のような用法もあるが,今回は考察の対象外としている」ということをはっきりとレポートで示すべきです。
First Created: 2004-06-28; Last Updated: 2007-04-03;
2001-2007 © CHIBA Shoju;
e-mail: schiba(at)reitaku-u.ac.jp or TSIBALE(at)nifty.com [read (at) as @]
* Note that TSIBALE(at)nifty.com is my private address, which accepts various encodings, incl. ISO 8859-1 (Latin-1) & utf-8.
PGP encryption is also available with TSIBALE(at)nifty.com: my public key is here (fingerprint: 0C52 DC03 CF5F 6B22 12F6 CD94 E447 0EB9 5D0C F30C)