世界遺産マイスター/国宝の伝道師Kの「地球に感謝!」

世界遺産検定マイスター、国宝の伝道師保有の読書好き。書籍、世界遺産、国宝という切り口でご案内します。最近は「仕事の心理学」として、様々な事象を心理学的見地から考察しています。

【読了】伊藤公一朗「データ分析の力 因果関係に迫る思考法」

今年117冊目読了。シカゴ大学公共政策大学院ハリススクール助教授の筆者が、因果関係分析に焦点を当てたデータ分析の入門を紹介する一冊。


筆者は、現代において「ビッグデータが存在するだけでは実務の改善には至らず、ビッグデータを解析しビジネス現場の意思決定に利用できる形にする分析力(アナリティクス)が重要」としたうえで「バイアスの問題については、データ観測数がどんなに増えても解決できない」「『因果関係の見極め方』においては、データの量が増えても根本的な解決にはならないので、私たち自身がデータを見極める力をそなえる必要がある」と指摘する。


因果関係立証の困難性の理由について「①他の要因が影響していた可能性がある②逆の因果関係だった可能性もある」とし「怪しい分析結果に基づく単なる相関関係が『あたかも因果関係のように』主張され、気をつけないと読者も頭の中で因果関係だと理解してしまっていることが多い」と警鐘を鳴らす。


では、どのようにすればよいのか。筆者は実例を挙げながら、幾つかの手法を紹介する。


<RCT(ランダム比較試験):現実の世界で実際に実験してしまう>
鉄則1:分析で明らかにしたい因果関係を測定できるような適切なグループ作りをする
鉄則2:グループ分けは必ずランダムに行う
鉄則3:各グループに十分なサンプル数を振り分ける
強み:因果関係が科学的に示せる、分析手法や結果に透明性がある
弱み:実験に費用・労力・時間がかかる


<RDデザイン:世の中の境界線をうまく使い因果関係に迫る>
鉄則1:「境界線」を境に1つの要素Xのみが「非連続的に」変化する状況を見つけ出す
鉄則2:境界線付近でX以外の要素が非連続的に変化していないかのチェックを行う
強み:仮定が成り立てばあたかもRCTが起こっている状況を利用できる、理解がしやすく透明性がある
弱み:成り立つであろう根拠は示せるが成り立つことを立証できない、境界線付近のデータに関しての因果関係しか主張できない


<集積分析:階段状の変化をうまく使い因果関係に迫る>
鉄則1:何らかのインセンティブが階段状であることを分析に利用できないか検討する
鉄則2:階段状で変化するのは分析で明らかにしたい要素Xだけであり、他の要素は階段の境界付近で非連続的に変化しないことを確かめる
強み:仮定が成り立てばあたかもRCTが起こっている状況を利用できる、理解がしやすく透明性がある
弱み:成り立つであろう根拠は示せるが成り立つことを立証できない、階段状に変化するインセンティブに反応した主体に対しての因果関係しか分析できない


<パネル・データ分析:複数グループに複数期間のデータが入手できる場合に検討する>
鉄則1:介入が起こった時期の前後のデータが、介入グループと比較グループの両方について入手できるか確認する
鉄則2:「平行トレンドの仮定」が成り立つかどうかの検証を行う
鉄則3:仮定が成り立つと判断できた場合、2つのグループの平均値の推移をグラフ化して介入効果の平均値の測定を行う
強み:RDデザインや集積分析以上に広範囲に利用できる、理解がしやすく透明性がある、介入グループに属するすべての主体に対して介入効果の分析が可能
弱み:成り立つであろう根拠は示せるが成り立つことを立証できない、平行トレンドの仮定は非常に難しい


これだけ手法があっても、「データ自体に問題がある場合は優れた分析手法でも解決が難しい」というのは言わずもがな、なるほど納得。


データ分析と簡単に言っても、実に難しいことなんだな、ということを痛感する…