ブログ

10年ほど前、勤めていた会社の上層部の方々と一緒に役員会議室にいた時のことです。会議の議題は、会社の売上高の月次報告が中心でした。当時は、会社の販売活動を把握するための報告書があったのですが、私はその報告書をさらに改善するための意見を述べるべく、この会議に参加することになっていました。雑談の後、CEOが部屋に入ってくるやいなや、「仮説検証をもっと考えないといけない!」と言いました。その意外な発言を私たちは誰一人として予想していませんでした。そしてCFOは、仮説検証とは一体何なのか、私が説明するのをやや待っていました。私は自然と肩をすくめ、CEOを振り返りました。答えを知らなかったからではなく、CEOがどういう意図で仮説検証と言っているのか、文脈がよくわからなかったからです。科学的な論文の仮説検証を指しているのか?それとも、問題解決に対する私たちの考え方全般のことを話しているのか?

前回のブログ記事ではp値についてお伝えしました。そして、その中で「仮説は推論である」ということを述べました。つまり私たちは推測を立て、それに対して課題を作り、その真偽を検証するのです。今回のブログ記事では、現在の文脈に存在する、2種類の仮説検証をご紹介します。

スーパーの青リンゴと赤リンゴを例にご説明しましょう。ご存じでない方は、このままお読みください。スーパーでは毎日、何千人ものお客がリンゴを買っていきます。そしてスーパーのスタッフはリンゴの在庫を補充する必要がありますが、スーパーでは青リンゴと赤リンゴが一つのカゴに混在しており、在庫維持のため、どの種類のりんごを補充すべきか把握するのが実に困難な状況になっています。ここで、スーパーが販売したリンゴの種類を記録していないと仮定すると(ただし販売したリンゴの総数は記録されている)問題が発生します。というのも、どちらの種類のリンゴの在庫が急速に枯渇しているのかを把握することができないからです。この問題を「経営仮説」と呼ぶことにしましょう。

そして、ここで私の出番です。私は問題を調べ、データの収集方法を見つけ出し、また、カゴから無作為にリンゴを選んだ場合の確率を計算した上で、問題解決のアプローチを決めます。ここで、このアプローチを「統計的仮説」と呼ぶことにしましょう。

先ほどの話で、仮説は推論であるとお話したことを思い出してください。推論とは、単なる推測に過ぎません。そして推測とは、不完全な情報に基づく結論の出ない意見のことです。先ほど例に挙げたスーパーの店員も、カゴの中のリンゴの数を推測するでしょう。もしくは、優秀なレジ係が、大抵のお客は赤いリンゴを買うということに気づき、「赤いリンゴは青いリンゴよりずっと少ない」と推測したかもしれません。あるいは、バックオフィスのマネージャーが記録に目を通し、補充は主に赤いリンゴであることに気づくかもしれません。

さて、まず始めに「ビジネス仮説」が生まれます。この例でいうビジネス仮説とは、スーパーの経営者は、その日その時点でカゴに何個リンゴが残っているのかについて、完璧な情報を持ち合わせていないものの、その比率をバランス良く保ちながら、正しい数量のリンゴを補充する問題をうまく解決したいと考えているということです。そして、これはまさに、私のCEOが部屋に入ってきたときに話していた類の「仮説」だったのです。

データサイエンティストが重要な役割を果たすのは、解決すべき問題やビジネス仮説があるときです。様々な分野での経験や専門知識を駆使して、解決できる可能性が最も高いアプローチを決定します。問題に対して必ずしも完璧な解決策を持っているわけではありませんが、効果的に問題を解決するためのアプローチを的確に判断することができます。例えば、まず、カゴからリンゴを20回無作為に選んで、赤いリンゴが出る確率を調べることができます。

まとめると、どの種類のリンゴが多いかを把握したいという問題がある一方で、カゴの中のリンゴの比率については限られた情報しか持っていません。そして、一日のある時点において、どちらの種類のリンゴがカゴの中に多くあるかを知りたいと考えています(ビジネス仮説)。そして誰か−おそらくレジ係がやってきて、「ランダムに20個のリンゴを選んで、その中に入っている赤いリンゴの数を数えてみたらどうだろう」と言います。「そうすることで、赤いリンゴより青いリンゴの方が多いことが推測されます。」と(統計的仮説)。ここで、ビジネス仮説は、多くの数値的な詳細には踏み込まないことに注意してください。もしビジネス仮説に数値的な詳細が含まれている場合は、それは不完全な情報から持ってこられた可能性が高いです。これがビジネス仮説と統計的仮説の大きな違いです。統計的仮説は、推測を数値化し、検証し、妥当性を確認しようとするものです。また、ビジネス仮説は、不完全な情報で問題を設定し、推測をしようとするものなのです。

Comment are closed.