―しがない農学徒の雑記帳―

しがない農学徒が日々思うところを書き散らします。

項目

宮沢賢治「銀河鉄道の夜」の共起語ネットワーク

2015/02/08

読書欲が旺盛な方が世の中には多数おられ、実際に文学少女とか文学少年という言葉が存在しますが、その一方で、僕には技術書や専門書以外の書物を読むのが非常に辛いです。とはいえ、ある程度は読んでおかないと、教養が無いということで恥をかいたり、好機を逃す場面もあるかと思われます。そこで、読書に先立ち、概要を知ることで、読書の苦痛を和らげることができないか?というのが今回のテーマです。事前情報のあるなしで読書の効率は大きく変わってくると思われます。Wikipedia であらすじを読めば良いじゃないか、という声が聞こえそうですが、あらすじを読んでしまうと、内容が分かってしまい、読書の動機付けが失われてしまいますので、今回は、どういったキーワードに注目して読めば良いのかを探ってみようと思います。

対象とするのは宮沢賢治の「銀河鉄道の夜」です。選択の理由は「何となく」です。読んだことないし。何だかロマンチックな感じがするし。方法は次の通りです。

結果が下の図です。 宮沢賢治「銀河鉄道の夜」の共起ネットワーク
図中の丸は出現頻度が上位であった名詞を示し、矢印は、共起関係を示します。例えば、「カムパネルラ」と「お父さん」は近接して出現し、「カムパネルラ」の次に「お父さん」が出現する事を示しています。

この図を見ると、「ぼく」、「カムパネルラ」、そして「ジヨバンニ」が繰り広げるストーリーであり、他に少なくとも「女の子」や「お父さん」が登場し、どうやら「窓」と「顔」が共起している事から、窓に映った顔を見るのかな? といった事が推察されます。

興味深いのは、1 人称として「ぼく」と「僕」の 2 種類が用いられており、「ぼく」は「カムパネルラ」と「ジヨバンニ」と共起しているのに対して、「僕」は「汽車」と共起していることです。実際に読んでいないので分かりませんが、賢治は文脈によって、平仮名か漢字かを使い分けている可能性が示唆されます。

という訳で、読書前に

ことにより、どういった語に注目して読めば良いのかを把握でき、延いては効率の良い読書ができるかもしれません。文学作品に対してテキストマイニングを行う事は、「作者への冒涜」であるような気がしないでも無いですが。。。