「明日から使えるシンプル統計学」で明日から統計学を使おう! 


ある人から教えてもらった言葉で、「普段からニュースにでてくる数字の統計的な意味をとらえるように訓練しておく」とビジネスの中で活かせるようになっていくというのを教えてもらったことがあります。

というのが少しでもできるようになりたいという気持ちから『明日から使えるシンプル統計学』を読み始めました。

今回はこの書籍から、特に参考になった点をピックアップしていきます。


🗽 統計が役立つ3つの場面

1) 問題解決 => 統計情報から課題を抽出する
2) 企画立案 => 提案の根拠を統計情報から示す
3) 説得 => 統計情報(数字)をパワーにしてジャッジを促す

🍮 統計を実務で活かす

難易度が低い => 平均・標準偏差・グラフ化により、データを読み込んで把握する
難易度が高い => 相関や回帰分析、検定を通してデータを統計的に分析する

大切なことは実務に活かせること、相手に納得してもらうこと。

🎃 平均・中央値・最大値・最小値

わかりやすくて理解しやすい値だが、事実のミスリーディングを誘発するパターンがあるので注意すること。それを防ぐために、正規分布や散布図やヒストグラムを効果的に活用すること。

🐹 比較の切り口

1) 時間 => 時間の経過により変化する。継続性を持つ
2) 競合 => ビジネス状況競合は、視点によって変化する
3) 計画 => 計画と比較・検証することで将来に活かせることが重要
4) 属性 => 地域別、商品のカテゴリーなど。適切な粒度が重要

🏀 比較すべき属性を見つける4つのステップ

「一番の目的は何か?」を念頭に置きながら、探りたい課題やキーとなる仮説を検証する。

1) 見ているデータの属性や、ブレークダウンの状況を把握する
2) そのデータに存在しうる属性を考える(商品、地域、人、顧客、時間、競合など)
3) 入手できるデータがある属性を確認する
4) 目的から考えて最も有効な属性をセレクトする

🎂 グラフの種類とセレクト時のポイント

折れ線グラフ => 継続性。変化率を示す
棒グラフ => 横並び。相対的な比較がやりやすい
円グラフ => 内訳や構成比率。

🚜 グラフ化のリスク

グラフはシンプルな理解を助ける一方で、ある要素を隠す場合がある。ハイライトすべき要素と、犠牲になる要素が何かを考える。

👽 相関分析

複数のデータを組み合わせることで、得られる情報を広げ、新たな光明を見出すための分析。

🎉 どんな課題に対して相関分析を使うのか?

# フロー型
複数のプロセスが組み合わっているようなパターンにおいて、「インプット」と「アウトプット」都の間の相関が弱い場合にはそこにボトルネックがあると考えられる。
# 結果・要因型
ある結果に対して1つ以上の要因の候補がある場合。各要因と結果との間の相関性を確認して、原因を調べ出す。ただし、「相関がある => 相関が強い」ということではないので注意が必要。
# データ羅列型
データの羅列から深堀りをすることで新たな関係性や課題を積極的に探すことで、有益なヒントを得ようとするアプローチ。

🤔 あえて弱い相関に着目する

# 相関が大きい点に着目
=> 複数のデータから強い関係性を特定する。理論的に強い相関があることを検証する
# 相関が弱い点に注目
=> 理論的にデータのつながりがあるはずが、実際に成立していないことを見つけて、問題を特定しようとする場合

🐡 擬似相関に注意

「ブランド力 => 売上」という結論には実は外部要因の「広告宣伝」によって成立している可能性がある。擬似相関をなくための理想的な条件は「各要因が独立しており、結果に対する因果関係が明確であること

🏈 単回帰分析

AとBとのデータの関係を数値で表現するための分析。アール二乗値(決定係数)は単回帰分析の精度を表す指標。

🐰 単回帰分析によってえられるメリット

1) 費用対効果などを出すことができる
2) 逆算して予測することができる
3) 要因によらない結果を求めることができる

🐮 分析の結果が「本当に使えるものか」を見極める

1) 分析にはどのような前提が含まれているか?
2) 分析結果を実務で使う上で、どのような制約や条件があるか?
3) 分析の結論が今の条件を変更するだけのメリットがあるか?
4) 条件が不明な場合には複数の結論を用意できるか?

😸 仮説検証型分析

仮説を作り、その検証に必要なデータを集めて、最適な手法で分析する。分析の主目的は、「将来の行動を決めるための根拠」を得ること。効果的な仮説づくりと、分析結果にもとづく精度の高い戦略づくりが重要。

🗻 手元に十分なデータがない場合

1) 「値」を「比率」になおしてみる
2) 要素を分解して取り出してみる
3) データの範囲を変えてみる
4) 他に入手できるデータを探してみる
5) 定性情報を定量情報に変える  

🐯 感想

たしかに本当に大切なのは「将来の行動を決めるための納得できる根拠」と「分析結果にもとづく精度の高い戦略づくり」だというのをすごく実感します。そしてそれをサポートするのが統計学だと思います。これからバランスよく、知識を身に着けていきたいです!

🖥 VULTRおすすめ

VULTR」はVPSサーバのサービスです。日本にリージョンがあり、最安は512MBで2.5ドル/月($0.004/時間)で借りることができます。4GBメモリでも月20ドルです。 最近はVULTRのヘビーユーザーになので、「ここ」から会員登録してもらえるとサービス開発が捗ります!

📚 おすすめの書籍