原題は、Uncharted: Big Data as a Lens on Human Culture。文化的な構築物(言語、発明、有名人、事件など)が、どのように登場し、どのように有名になり、どんなタイミングで消えていったのか。歴史や文化を、グーグルのNグラム(書誌情報のビッグデータ)で追跡した話題の書。
本書は、文化の諸相を測定しつつ計量化するという触れ込みになっている。だが、それよりも、書誌情報から抜き出した「単語」(ことば)の頻出度数の時系列推移から、流行のパターンを摘出する手法である。
従来の社会科学の手法との近似性は、ロジャーズの革新の普及モデルの言語版であるという点だろう。本書では、しかし、ロジャーズや流行の伝搬の理論については、ほとんど言及されていない。コンピュータサイエンスの研究者にかかると、そういうものなのかと大きな違和感が残った。
競合する人物や概念(たとえば、アーネスト・ヘミングウェイとアル・カポネ)の頻度の時系列推移を見ることで、歴史文化的な枠組みから、概念対象の盛衰を解釈する手法の紹介である。グーグルが電子化した3000万冊(世の中の書誌全体の3%?)から、単語(言葉)だけ、歴史的な事象を覗いていく不思議である。
分析の俎上に乗っている対象は、単語(第3章)、名声(第4章)、政治体制(第5章)、流行(第6章)である。
大容量のデータがなしには、分析ができない内容である。だが、本書の後ろに行くにしたがって、記述内容が予測できてしまい、読書の意欲が低減していくことになった。
とても興味深い書籍なのだが、最後は、「ふーん、そうなんだ」で感想を終えることになる。今年の夏合宿のテキストである。合宿所での学生たちにとって、議論が弾むコンテンツだろうか?