#03 因果関係を見抜く / 1. 「データいじり」を乗り越える

=====================
《ビジネス×サイエンス》
#03 因果関係を見抜く

   ■ 0. 「ビジネス×サイエンス」の背景
   ■ 1. <導入> 「データいじり」を乗り越える (このページ)
   ■ 2. <ビジネス編(前)> ビジネスケーススタディ: データが結論を導くとき
   ■ 3. <ビジネス編(後)> ビジネス上のキーポイント: 原因と結果の落とし穴
   ■ 4. <サイエンス編(前)> 因果関係の定義: ホンモノとニセモノ
   ■ 5. <サイエンス編(後)> 定量的手法: 因果関係を数字で測る
=====================

■1. <導入> 「データいじり」を乗り越える

「ビジネスには、データを使うべし、ファクトに基づくべし。」

そんな標語が目新しかったのは1980年代頃でしょうか。それから数十年間が経過し、情報通信技術は信じられないほどの進化を遂げました。経営技術はどれだけ進化したでしょうか。

「市場調査」や「データ分析」と称して、今や様々な情報が企業経営や行政運営の意思決定者のまわりにはあふれています。「調査」を「リサーチ」や「サーベイ」と言い換えてみたり、データベースを使った分析を「データマイニング」と呼んでみたり「KPI(Key Performance Indicators)モニタリング」と呼んでみたり。「ビジネス・アナリティクス/Business Analytics」や「ビジネス・インテリジェンス/Business Intelligence」といった一般名詞のような名前を自社製品につけるベンダーも。

たいそうな名前で業者から提供される情報のほとんどは、「へーそうなんだ。」と参考になる程度のものでしょう。ビジネスの基礎的な理解のために定量的な情報を一通り漁っておくことも、特に全く知らない業界に初めて取り組む時などには大切なことです。ですが、そういった参考程度の情報は、経営の指針、「羅針盤」となるのでしょうか。ならないとしたら、本当に「羅針盤」として機能するためには何が欠けているのでしょうか。

 

■1.1 よくある”マーケティング調査”、”データ分析”

「データ」としてよく出てくる例を挙げてみましょう。どんな業界でも共通部分が多いものですが、例としてモバイル端末の業界を想定してみましょう。(数字はダミーです)

まずは市場シェアの推移。自社が競合他社に勝っているか負けているか、いつも気になるものです。競合他社を1ポイントでも上回れるかどうかに日々一喜一憂。では、競合他社よりシェアが負けているのはいいとして、ではそのギャップの理由は何でしょうか?このグラフは何も教えてはくれません。

図:市場シェア

図:市場シェアの近年の推移

それならばもっとお客様に近い情報をと考えて、サービス満足度をアンケートで調査して追跡したり、同じ顧客が再訪してくれているかを毎月確認したり。これらの情報で、この業界の最近のトレンドはなんとなく掴めてくるでしょう。「どうやら、自社は満足度が下がっているのでリピート率が下がっているようだ、それでシェアが足踏みしているんだろう」と。・・・で、それで結局、何をすればいいんでしょう?

図:各社の顧客の満足度の変化

図:自社の顧客のリピート率の変化

何をすればよいかを探るべく、目安箱に入れられた新サービスの要望を見てみます。逆にネガティブな情報として、顧客から寄せられたクレームの集計も。では、これを件数の多いものや深刻なものから優先順位をつけて全部反映させていきましょう。防水機能をつける。TV視聴機能をつける。PCメールも携帯メールもワンタッチで使えるようにする。ワンタッチでカメラが起動するボタンをつける。文字の表示サイズを大きくする。いや、小さくする。マナーモード解除時に警告表示する。分かりやすいように音を鳴らす。いや、周りの迷惑だから音は出さない。・・・いつのまにか、以前に増して売れない商品になってしまいました。何が間違っていたのでしょうか?

図:要望が多い新サービス

図:多く寄せられたクレーム

「ビッグデータ」の流行に乗って、自社製品の利用者の履歴情報を分析してみました。これはこれで話のネタになる面白い発見はありました。でも、利用時間が短い機能・アプリは、ニーズがないのか、それとも機能が貧弱だからかでしょうか。使用時間が少なく使いこなしていない人が一定数いますが、ニーズがないのか、それとも使い勝手が悪くて使えていないのでしょうか。結局、役に立ったのは知的好奇心を満たして、いくつか思い違いを修正したくらいで、それでも意味はあったと納得することになりました。

図:使用しているアプリ・機能の合計時間数

図:一日の使用時間別の割合

「ソーシャル」や「オウンドメディア」の流行にも乗って、ソーシャルチャネルでのリーチも調べてみました。マーケティング部門のソーシャル担当者の腕の良し悪しくらいは見当がつきますが、それで次にどうすればよいでしょうか。

図:SNSでの購読者数

 

実際に心当たりのある場面もありましたでしょうか。

これらの例は、冒頭の標語のとおり、確かにファクトに基づいて多岐に渡るデータを使っています。多くの方にとって、市場調査やデータの活用と言えばこのようなイメージだと思います。電機に自動車、消費財、小売、外食、金融、運輸、エンタメなど、どの業界でも、ごく限られたエクセレントカンパニーを除く大半の企業では似たり寄ったりの状況だと思います。

このような情報でも、長年その業界を勘と経験で切り開いてきた人でも思い込みが間違っていたところがいくつも露わになるはずです。ある程度の事業規模であれば、一定のコストをかけてもその価値は十分取り返せるでしょう。そういった気づきによって、売上を逃していた数%を取り込む効果があるとすれば、売上数十億円以上の事業規模であれば、市場調査などの情報収集に数千万円をかけても割に合うはずです。

ですが、これらが企業にとって「羅針盤」のように指針を指し示す力があるかと言えば、そこまででもないところです。社内のデータオタク集団が勝手にやっている、という程度の位置付けの企業も少なくないものと思います。そんな「データいじり」のレベルを超えるにはどうすればよいでしょうか。

 

■1.2 原因を探る戦略と科学

この問いに答えるための切り口として、以降は4つの節に分けて進めます。

・(p.2) <ビジネス編(前)>ビジネスケーススタディ: データが結論を導くとき
・(p.3) <ビジネス編(後)>ビジネス上のキーポイント: 原因と結果の落とし穴
・(p.4) <サイエンス編(前)>因果関係の定義: ホンモノとニセモノ
・(p.5) <サイエンス編(後)>定量的手法: 因果関係を数字で測る

それぞれの詳細に入る前に、各節のポイントをご紹介しましょう。

・(p.2) <ビジネス編(前)>ビジネスケーススタディ: データが結論を導くとき

「データいじり」に迷走するケースと、データが明瞭な結論を導き出すケース。

その違いを探るために、「取るべきアクションの明確な指針を導き出せたとき、逆に切れ味が鈍かったときはどのようなケースだったか」をまず考え始めました。

具体的なケースをまず一つ考えてみましょう。

ケース1:顧客コミュニケーション

Eコマース(ネットショップ)運営のA社。メルマガ、facebookページ、twitter公式アカウントと、情報チャネルを併用して顧客コミュニケーションを行ってきました。

様々な部署がメルマガに送りたいと言ってくるのに任せて送っていました。最近は、本数が多すぎて煩わしい、という声が増え、開封率も10%程度にまで低下してしまいました。数百万人のアクティブ会員がいるのに、その90%には情報を届けられていない状況です。頻度を抑えればよいのか、どんな頻度が境界なのか、見当がつきませんでした。

相談を受けて、以下の調査・分析を行いました。

==========
企業からのメルマガを週に1通以上受け取っている人3,000人をランダム抽出してウェブアンケート

Q1. あなたは企業からのメールを受け取っていますか。受け取っているもの全てについて教えてください。
  1. 業界を選択
  2. 企業の名前
  3. そのメールの頻度
  4. HTML/テキスト
  5. 開封している割合

Q2. 前問でお答えになった企業からのメールそれぞれの頻度について、以下の文章は当てはまりますか。
  1. もっと頻繁でもよい
  2. 今の頻度のままがよい
  3. もっと少なくてよいが、不快なほどではない
  4. 頻繁すぎて不快に思う
==========

このようなデータがあったとき、多くの企業で当然のように作られるのは以下のような集計です。

図:集計結果

これを見ると業界ごとの実態は把握できます。市場調査会社や経営コンサルティング会社に発注しても似たようなものが出てきます。ですが、これでは現状認識の参考資料で終わってしまいます。

では、次に、Q1とQ2の情報と組み合わせた以下の集計だとどうでしょうか。

図:集計結果

今度は、「週に1回、一日に1回という頻度がそれぞれ、不快に感じる人が増える境界になっている」という結論が導かれ、それによって具体的なアクションが決まってきます。

さらに詳しく見ていくと、メルマガ会員のタイプによってグループ分けするとそれぞれで不快に感じる境界が異なること、そのメルマガの内容への関心度合いによって分けても不快に感じる境界が異なることも分かりました。これにより、その人が不快と感じない境界線の位置、興味の度合いによって、メール配信の頻度を調整する仕組みが必要だと、顧客コミュニケーションを立て直す方針が定まりました。

 

とてもシンプルなことですが、参考資料で終わってしまう前者と、明確にアクションを指し示す後者。

そう、違いはまさに「原因と結果」を解き明かすものになっているかどうか。後者はメール頻度という「原因」と、不快感という「結果」との関係を解き明かします。前者にはそのような構造がありません。

≪(p.2)では、必ずしも定型ではないケースを見ながら、「原因と結果」を解き明かす基本構造を探っていきます。≫

 

・(p.3) <ビジネス編(後)>ビジネス上のキーポイント: 原因と結果の落とし穴

「原因と結果」は、一方でなかなか手強い存在でもあります。その難しさは、ビジネスセンスの面にも数理センスの面にもあります。まずビジネスセンスの面から考えてみましょう。

「原因と結果」を本当に経営戦略の武器として使いこなせる人にはなかなかお会いすることが少ないものです。それはなぜか。その事業における「原因」と「結果」、それぞれに対して深い洞察を重ねてきた長い経験が、それを分けるのではないかと思います。

まずは「結果」について。「結果」として企業が求める「目的」は何でしょうか。売上の拡大、利益の拡大。そう単純に済むものではありません。

あるときは顧客の不安を解消して信頼を築くことに全力を注ぐべきでしょう。あるときは直近の売上拡大よりも本当に付き合ってくれるファン基盤の拡大に努めるべきでしょう。あるときは既存顧客の維持か新規顧客の開拓かの二者択一を迫られるでしょう。

「結果」=「目的」の設定は、経営の意志そのものなのです。

 

そして「原因」について。「結果=目的」をもたらすための「原因」はどこにあるでしょうか。

一昔前までは、「ファネル」という考え方がマーケティングの定番でした。

図:ファネルの例

「認知」「関心」「検討」「購入」「継続」のステップを消費者が進むものと考え、この漏斗のどこで消費者が詰まっているのが原因なのかを見つけることで解決策を考えよう、という発想です。

ですが、消費者はこんな単純なステップを踏むものでは必ずしもありません。消費者の行動と心理の変遷をひとつひとつ追っていく「customer journey」という発想が現代的なマーケティングでは当たり前になりました。

図:customer journeyの例

この「journey」の中では、ひとつの体験で消費者が「この商品が欲しい!」と考え始めることもあるでしょう。あるいは、別の経験で消費者が「なんだか不安だな」とほとんど無意識に感じ始めることもあるでしょう。

「原因」を本当に見抜くためには、その商品・サービスの特性から、販売チャネルや情報チャネル、そして消費者の意識・無意識の心理までを考え抜く必要があるのです。

図:消費者の心理と企業行動

これらは当然ながら、データおたくに任せていればなんとかなることではありません。数理的手法に頼り切るのではなく、「目的は何か」、「顧客は何を思っているか」、これはまさに企業存立の根幹として経営者が自身で考えるべきことなのです。

≪(p.3)では、具体的なケースも考えながら、この「原因」と「結果」の考察を深めます。≫

 

・(p.4) <サイエンス編(前)>因果関係の定義: ホンモノとニセモノ

そもそも原因と結果をつなぐ「因果関係」とは何か。実はこれが簡単ではないのです。

「因果関係」は基本的には、「Aが起こったらBが起こる」という形をしているはずです。

    (1)「(A)コップが机から落ちた。(B)コップが割れた。」

この場合は、<Aが原因、Bが結果>の因果関係がある、と誰もが考えるでしょう。では、これはどうでしょうか。

    (2) 「(A)コップが机から落ちた。(B)玄関でチャイムが鳴った。」

これに因果関係があるとすれば、魔法とファンタジーの世界か、「ピタゴラスイッチ」式のからくり装置か・・・。因果関係があるとは普通は思いません。

(1)は、コップを机から落とす動作を100回繰り返せば、そのうちほとんどでコップが割れるでしょう。一方で(2)は、コップを100回机から落としても、ちょうど同時に玄関のチャイムがもう一度鳴ることはなさそうです。

 

では、数を増やせば因果関係を捉えられるでしょうか。例えば以下のような集計になった場合。

Bあり Bなし 合計 B発生率
Aあり 900人 100人 1000人 90.0%
Aなし 100人 900人 1000人 10.0%

Aが起こったときにはBが起こる確率が90%。Aが起こらなかったときにはBが起こる確率が10%。明らかにAとBには因果関係があるように見えます。

ですが、それがそうでもないのです。

図:因果関係のホンモノとニセモノ

「相関関係があっても、必ずしも因果関係があるとは限らない」。このこと自体は知識としてご存じの方も多いでしょう。

実用上必要なのは、相関関係を見たときに、因果関係があるホンモノなのか、それとも因果関係はないニセモノなのかを見抜く目です。そして大事なのは、いくら数字とにらめっこをしていてもこれを判別できないということです。

≪(p.4)では、具体的なケースを見ながら、「因果関係のホンモノとニセモノ」を考えます。≫

 

・(p.5) <サイエンス編(後)>定量的手法: 因果関係を数字で測る

そうは言っても、「具体的な計算方法を教えてくれ」という方もいらっしゃるでしょう。

因果関係の有り無し、強さ弱さは、どうやって比べられるでしょうか。例えば、「原因」と「結果」を散布図にプロットしたとき、以下のどれが因果関係がより強いと言えるでしょうか。

図:相関の度合いが違う散布図

(1)より直線に近い分布になっているケースは、因果関係の明瞭さは強いようです。(2)より傾きが急になっているケースは、原因側が変化した時の結果側の変化が大きいことを意味します。(3)点の数が増えているケースは、因果関係が「ある」と自信を持って言えるでしょう。

因果関係の強さを数値化するにしても、何を数値化したいのかを自分で理解していなければ、結局は数字に振り回されて終わってしまうのです。

≪(p.5)では、数値化の方法を整理します。交絡を避ける手法についても触れます。≫

 

まず次のページでは、ビジネスの側面として、様々なケースを見ながら、原因と結果がどのように浮かび上がるかを見ていきましょう。

>>2. <ビジネス編(前)> ビジネスケーススタディ: データが結論を導くとき

=====================
《ビジネス×サイエンス》
#03 因果関係を見抜く

   ■ 0. 「ビジネス×サイエンス」の背景
   ■ 1. <導入> 「データいじり」を乗り越える (このページ)
   ■ 2. <ビジネス編(前)> ビジネスケーススタディ: データが結論を導くとき
   ■ 3. <ビジネス編(後)> ビジネス上のキーポイント: 原因と結果の落とし穴
   ■ 4. <サイエンス編(前)> 因果関係の定義: ホンモノとニセモノ
   ■ 5. <サイエンス編(後)> 定量的手法: 因果関係を数字で測る
=====================