「仕事でデータを活用できるようになりたい」「でも何から取り組めばいいのか分からない」...そんな想いを抱えている人もいるのではないだろうか。
そこで本企画では、『ゼロからわかる!公務員のためのデータ分析』の著者、福岡県糸島市職員の岡祐輔さんに、公務員として知っておきたいデータ分析の基本を教えていただく。
第3回のテーマは「知っておきたい2つの分析術」。岡さんがオススメする分析術とは、どんなものだろうか。早速見ていこう。
【連載|公務員が知っておきたいデータ分析】
(1)公務員がデータ分析をするメリットとは?
(2)データ分析の基本思考を身につけよう!
(3)2つの分析術を使いこなそう! ←今回はココ
データ分析の肝は「どう料理するか」
前回の記事から約1カ月が経過しましたが、第1回のデータで遊んでみることや、第2回の分析の基本思考を実践していますか?まだの人は、だまされたと思ってぜひやってみてください。きっと新規事業を企画するときに、自然とデータ分析の思考回路になってくるはずです。
さて、前回は「ふるさと納税の寄附額を上げたい」という目的に対して、そもそもの「寄附者数が少なく」、せっかくまちのポータルサイトに訪問してくれた人の「寄附率が低い」ことで寄附者数が少ない一因になっている、そこでポータルサイトに訪問した人は選べる「返礼品数が少ない」から、そのまま寄附をせずに別のサイトに行ってしまうのではないかと考え、返礼品数や寄附件数、寄附額のデータを集めてみようと考えました。
ここまで来たら、これをどう料理するかが最後のデータ分析です。
回帰分析とは?
第1回で使った表の「自治体のふるさと応援寄附額と寄附額増加の要因」から、縦軸に寄附額、横軸に返礼品数をとって、各自治体を比較してみました。
すると、返礼品数が多いまちの方が、寄附額が高いことが分かります。魅力的な返礼品が多いと寄附率が上がることに加え、WEBで検索するときに目当ての返礼品名にヒットする確率も増えるので、よりサイト流入数が増え、寄附者が増えることも想定されます。
(筆者作成)
もし自分が担当者なら、グラフを見れば間違いなく、返礼品数を増やすための事業や行動を取ろうと考えるでしょうし、企画書でこのようなデータを見せることで説得力も抜群に上がります。しかも目標の寄附額に対して、何品くらい増やすのかも目途が立ちます。
前回の記事で、自治体職員は、高度専門的な手法を使う必要はなく、基礎的な分析手法を実践で使えればよいと書きましたが、これは中学校で習う一次関数のグラフを使っただけです。「回帰分析(単回帰分析)」と呼ばれ、X軸(横軸)に要因、Y軸(縦軸)に結果をとることがルールです。X軸を広告費に変えたり、ポータルサイト数に変えたりするだけで、どの要因の効果がより高いかを比較できます。
ただし、返礼品の場合は寄附額が伸びたから、返礼品数が増えた可能性もあり、どちらが要因(X軸)か分かりませんので、このような相互関係がある場合は「相関分析」といいます。第1回の記事で、1.0が最大で関係が強く、0が全く関係ないことを説明しましたが、グラフ中のR2=0.73(決定係数)というのは「相関係数(R)の2乗」を表し、相関係数0.85という数値になっていることが確認できます(端数で多少ずれています)。
ぜひY軸の目的を決めて、仮説を立てて収集した要因データをX軸に当てはめて、使ってみてください。
クロス表分析とは?
もう1つ知っておいた方が良い分析方法がありますので紹介します。
相関分析や回帰分析は量的データで利用できますが、寄附者が寄附を「した」「しない」といった2択は、寄附額や返礼品数のように細かい数量を表せません。カテゴリー別の質的データを分析する必要があります。
このようなデータは、「クロス表分析」を使うと便利です。
例として、I市では、ふるさと納税のリピーター獲得のために、毎年に何万通ものカタログ冊子のDM(ダイレクト・メール)を過去の寄附者に郵送しているとします。このDMに対する寄附者の反応率(寄附率)は20%程度です。安価なはがきを送付している自治体もあり、どちらの方が高い効果(反応率)があるか分かりません。
このような広告効果を調べるために、試しに数百件だけ、はがきを送ってみることにして、双方の反応率を調べることができます。
カタログとはがきの広告効果の比較
|
寄附あり |
寄附なし |
計 |
カタログ |
33(21.3%) |
122(78.7%) |
155(100%) |
はがき |
11(11.2%) |
87(88.8%) |
98(100%) |
(筆者作成)
これまで寄附してくれた人に、カタログを送ると21.3%の人が寄附してくれ、はがきだと11.2%しか寄附してくれません。つまり、「10%の差がつく」ということです。カタログにかけるコスト増に対して、寄附額が10%伸びた方が効果が高いなら、カタログを送り続けたほうがよいと考えられます。寄附額が10億円のまちであれば、1億円も違うことになり、担当者のアイデアひとつで大きな利益を生み出せます。
このようにクロス表分析では、効果があるかないかをカテゴリー(質的データ)ごとの「比率の差」で検証することができます。
クロス表分析でも、回帰分析と同様に、要因を表の左におくルールです。「寄附あり」「寄附なし」の要因である表の左側(カタログなど)を色々変えて調べ、効果のある政策を打つことができます。このように要因ごとに分析が必要になるという理由で、比率の合計100%は、横の要因ごとに集計する(大事です!)ことになります。縦(寄附あり・なし)に集計しないように気をつけましょう。
データ分析をさらに学びたい人のために、少し補足しますが、クロス表分析のときに、今回のような10%の差がある(効果が高い)という結果が本当に正しいかどうか検証する方法に「χ(カイ)二乗検定」があります。χ2(2)=8.839, p<.05のように表示をして、「数百人のサンプルだけでなく、もし全員で試しても、95%以上同じ結果になる(「寄附額」に10%の差が出る)よ。偶然じゃないよ」という意味です。終始述べていますが、このような専門知識より、まずは実務担当者として、基本的なクロス表分析を使えるようになることが重要です。
さらに余談ですが、このクロス表分析の内容は、AとBの2種類のどちらの薬が効くかに似ています。EBPMはEBM(Evidence-based medicine)と医療分野が発端ですので、このような分析方法は以前から使われてきました。
皆さんは、この分析方法を覚えたことで、総務省のEBPMに関する資料17ページにある八王子市のワクチン接種率を高める啓発チラシの事例(https://www.soumu.go.jp/main_content/000677734.pdf)の意味が容易に理解でき、同じ分析ができるようになりました。2種のチラシの効果を「接種あり」と「接種なし」で調べるのは、さき先ほどの「寄附あり」「寄附なし」でやったことと同じです。
この回では、量的(定量)データと質的(定性)データの2つの分析方法を紹介しましたが、これで皆さんは仮説を立て、集めたデータを十分料理できるようになったはずです。
ここで第1回からこの第3回までをおさらいしながら、ぜひご自分の担当業務にあてはめて、考えてみてください。きっとデータを用いた政策立案ができるようになり、より効果の高い事業が誕生するはずです。
あっという間に、お別れになりましたが、EBPMそのものは、今後普及し、すたれることなく、長期的に必要になるスキルです。これをきっかけに長い目でデータと触れてもらえればと期待しています。3回にわたって、読んでいただきありがとうございました。
もっと読みたい
「仕事でデータを活用できるようになりたい」「でも何から取り組めばいいのか分からない」...そんな想いを抱えている人もいるのではないだろうか。
そこで本企画では、『ゼロからわかる!公務員のためのデータ分析』の著者、福岡県糸島市職員の岡 祐輔さんに、公務員として知っておきたいデータ分析の基本を教えていただく。
プロフィール
岡 祐輔(おか ゆうすけ)さん
福岡県糸島市の現役公務員。仕事をしながら九州大学大学院でMBAを取得。データ分析、マーケティング戦略など、学んだ知識・技術と現場主義を活かし、様々な地域づくりをやり遂げる。その実績が認められ、様々な賞を受賞した。現在は九州大学大学院博士課程に在学し、地域経済の成長を実現するための分析力、政策立案スキルを磨きながら、新たな地域政策に挑戦している。
著書
『スーパー公務員直伝!糸島発!公務員のマーケティング力』(学陽書房)
『地域も自分もガチで変える!逆転人生の糸島ブランド戦略』(実務教育出版)
『ゼロからわかる!公務員のためのデータ分析』(学陽書房)