研究ブログ

「東日本大震災ニュース分析」を公開しました

東日本大震災から1年が過ぎました。震災1周年に向けて、私は2つのプロジェクトに取り組みました。一つは以前に公開したエレクトリカル・ジャパンのリニューアルですが、もう一つが1周年プロジェクトとして重点的に取り組んだもの、すなわち東日本大震災ニュース分析(3月12日公開)です。



このサイトは、東日本大震災直後からヤフーニュース(Yahoo! Japan News)で配信された震災関連記事20万件以上を整理し、震災直後から復興までの過程を振り返ることができるようにしたものです。残念ながら記事の本文は閲覧できませんが、タイトルを並べたタイムラインを眺めるだけでも、震災直後の緊迫した状況から、その中でも印象に残ったできごと、そして震災後に発生した諸問題の経過など、様々な側面から時間の流れを振り返ることができます。



またGeoNLPプロジェクトの成果を活用して、震災関連記事に登場する地名の分析と地名マップの構築なども行っています。これにより、市町村や小学校単位で記事のタイムラインを作ることも可能です。そして各地名の記事数を都道府県ごとに集約すると、日々の重要地名のように都道府県ごとの日々の記事数の推移を調べることもできます。その結果によると、一位は「福島」のことが多く、ときどき「宮城」が一位に浮上しています。やはりこの2県の記事が多いことが一目でわかります。

★★★

さて、この震災ニュースプロジェクト、私がいろいろ取り組んだ震災関連プロジェクトの中でも、実は一番初めに着手したものなのです。調査を開始したのは震災当日の3月11日、翌日の3月12日からはニュース収集を開始しました。私はデジタル台風:ニュース・トピックスという似たようなシステムを2003年から運用していましたので、これを少し改良すれば地震ニュースにも使えるのではないか、というのが私の最初のアイデアでした。

そこから急いでシステム構築に着手し、未完成の仮バージョンを「東北地方太平洋沖地震関連情報」の最初のコンテンツとして公開したのが3月16日。まだまだ改良すべき点は多々あったのですが、その時点で私は作業を中断することを決めました。それは福島第一原発事故の状況が日に日に悪化しつつあったからでした。

福島第一原発から放射性物質の拡散が始まるにつれて、「風向きデータがない!」ことに多くの人々が大騒ぎするようになっており、気象庁がデータを隠ぺいしているのではと疑う人々まで出る事態になっていました。またSPEEDI予測も公表されなかったため、人々は拡散予測を求めて外国気象機関のウェブサイトに殺到していました。それに対して、私の手元には気象庁による風向き(シミュレーション)データがあり、GPV Navigatorというサイトで公開もしていたのですが、一般の人々でもわかりやすい表現にはなっていませんでした。この状況で私ができることは何か。福島第一原発周辺の風向きデータをわかりやすく提供することではないだろうか。どう見てもそちらの方が、ニュース記事の整理よりも優先度が高いと思えました。

私の最初の構想は、震災ニュースプロジェクトを数日でさっと完成させてから風向きプロジェクトに移るというものでした。しかし作業が遅々として進まない間にも放射性物質の拡散は悪化するばかりで、私は焦りました。震災ニュースプロジェクトなどやっている場合ではないと。そこで震災ニュースプロジェクトは未完成バージョンのままで打ち切り、風向きプロジェクトに作業の重点を切り替えることを決めました。

そうして数日後に緊急公開したのが福島第一原発周辺の風向きマップです。可能な限り急いで作業を進めましたが、やはり作業切り替えの判断が遅すぎました。風向きマップを公開できたのは3月22日、放射性物質の大規模拡散が発生した3月15日や3月21日には間に合わなかったのです(参考:福島第一原発周辺の風向・風速を公開しました)。

その後も福島第一原発事故に関するデータ処理を続ける中で、震災ニュースプロジェクトは緊急性が低いと判断せざるを得ず、各種の作業は後回しとなりました。しかしこのことが、震災発生直後の記事収集における網羅性の問題につながりました。私は台風ニュースでの経験から、「地震」や「震災」というキーワードを含む記事を検索して収集すれば、震災関連ニュースはおおむねカバーできると考えていました。ところが少したって落ち着いてからチェックしてみると、「津波」というキーワードも必要だと思えてきて、これを追加することになりました。さらに「地震」等の言葉を含まない震災関連ニュースが存在することにも気づき、ヤフートピックスからも記事を収集することにしました。

さらに大きな問題となったのが「原発」です。ニュース収集開始時に、原発事故関連ニュースを震災関連ニュースに含めるべきかどうかという点に迷いましたが、原発事故と震災は区別して扱うべきだという妙に潔癖な考えのもと、あえて「原発」というキーワードは使わなかったのです。しかし今から考えると、東日本大震災と福島第一原発事故を「原発震災」という一連の災害として扱わなかったのは、事態の見通しを誤ったと言わざるを得ません。4月に入るとさすがに判断ミスが明らかになってきましたので、「原発」等のキーワードも含めることにしました。その後、可能な限り遡及的に収集してはみたものの、「地震」「震災」等のキーワードを含まない原発関連記事の一部がコレクションから漏れてしまいました。その詳しい状況については、サイトで扱うデータをご覧ください。

その後も震災ニュースプロジェクトは後回しの状態が続きましたが、記事収集だけは継続していましたので、震災関連記事は着実に増加していきました。記事数が10万を越え、1周年の日には20万にも迫ろうという状況を見て、そろそろ過去を振り返るのによいタイミングが来たと思いました。そこで1周年プロジェクトとして、震災関連ニュースの分析が可能なウェブサイトの構築に着手することにしました。震災直後に最初に着手したプロジェクトなのに完成は最後となってしまいましたが、開始からちょうど1年たった3月12日に、ようやく「東日本大震災ニュース分析」の公開に至りました。

今後はこのコレクションを、東日本大震災に関するメディア分析研究に使ってみたいと考えています。震災に関して何が報じられたのか。逆に何が報じられなかったのか。どこの場所がたくさん報じられ、一方どこの場所が見過ごされてきたのか、こうした問題についてメディア研究者などと勉強会を開きながら調査を開始しています。テレビやソーシャルメディアなどと比較した分析も重要です。そうした分析を続けながら、「次」の災害に備えたよりよいメディアの構築を考えることが長期的な目標になると考えています。

★★★

東日本大震災から1周年、これを機会に、震災後にまとめてきた各種データを東日本大震災アーカイブと位置づけ、長期的な取り組みにシフトしていく予定です。以下、これまでの経過をブログ記事でたどってみます。
2週間後の記事で取り上げた「今後の課題」については、少しずつ実現しつつあるところです。また、震災プロジェクトを機にいろいろな人たちとも出会いましたが、そうした縁が今後につながっていけばいいなと思っています。