相関分析結果と重回帰分析結果、どちらが活用しやすいかNPSコンサルタントが考えてみた
みなさま、こんにちは!NTTコム オンラインの剣持(けんもつ)です。
今回は少し上級者編です。NPS®のアクションドライバー分析を行う際に、縦軸として使うのは相関分析結果、重回帰分析結果のどちらが使いやすいのか!?についてお話したいと思います。
アクションドライバー分析について
はじめにアクションドライバー分析についてですが、こちらは以前、松山さんが記事を書いておりますので、こちらも是非、ご覧いただけますと嬉しいです。
基本的にアクションドライバー分析は、横軸に推奨度に影響を与える要因(以下、ドライバー要因と呼びます)の平均満足度を、縦軸に各ドライバー要因の推奨度への影響度を設定することにより、「推奨度に対する影響が強いにもかかわらず、お客様を十分に満足させていない要素」を抽出し、優先的に改善していくことを目的としています。
この縦軸について、相関分析結果を用いた方が良いのか、重回帰分析結果を用いた方が良いのかを、今回のテーマにしております。
相関分析について
ここではイメージしやすいように、ドライバー要因はコストパフォーマンスと品質の2つある、という前提で考えていきたいと思います。
相関分析は2つの変数の間にどのくらい相関があるのかを分析するもので、算出される相関係数で相関の状況を判断します。相関係数は-1~1までの値となる係数で、2つの変数の相関は、相関係数によって以下のように解釈できます。
アクションドライバー分析の縦軸に相関係数を用いる場合は、今回の例で考えると、コストパフォーマンスと推奨度との相関係数および品質と推奨度との相関係数を算出して散布図上に当てはめていくことになります。
ちなみに私どものこれまでの調査経験から、各ドライバー要因と推奨度との相関係数は0.4~0.7くらいになることが多いです。
重回帰分析について
一方、重回帰分析については、統計的には多変量解析と呼ばれる方法で、少し難しい内容になります。以下、少し難解ですが、お付き合いいただけるとありがたいです。
重回帰分析では予測したい変数を目的変数、予測したい変数に影響を与えると思われる変数を説明変数と呼び、目的変数を説明変数で表す重回帰式を明らかにする分析方法のことを言います。
今回の例で考えると、重回帰式は以下のようになります。
推奨度=β1×コストパフォーマンス+β2×品質+定数+誤差
この重回帰式についてですが、相関係数同様、この重回帰式の当てはまりの良さを示す自由度調整済み重決定係数という係数があり、この係数で当てはまりの良さを判断し、一定以上の当てはまりがあれば、この重回帰式が使えることとなります。紙幅の関係上、自由度調整済み重決定係数は他のサイトに説明を譲ります。ご興味のある方はご確認してもらえると助かります。
ある程度当てはまりが良いことがわかったら、次に推奨度に対する影響度を重回帰式から導き出します。
重回帰式で、コストパフォーマンスにかかっている係数と品質にかかっている係数(この係数のことを偏回帰係数と呼びます)が大きければ、推奨度に与える影響も大きくなることがおわかりかと思います。
この偏回帰係数の大きさが「推奨度に与える影響度」ということなのです。
ここで注意すべきは偏回帰係数が0でないかどうかを確認しなければいけないことです。仮に、偏回帰係数が0であれば、そこにかかっているドライバー要因がどんな値を取ろうとも0がかかっているので、推奨度に与える影響は常に0ということになります。
すなわち、偏回帰係数が0ということは、そのドライバー要因は推奨度に影響を与えていないということになってしまうのです。偏回帰係数が0かどうかについてはt検定により判断することができます。
t検定の説明は省略しますが、重回帰分析を行うことができるソフトであれば、t検定結果も一緒に出力されることがほとんどなので、その出力結果から判断することができます。具体的にはt検定結果でp値と呼ばれる数値が5%(0.05)以下であれば、そのドライバー要因の偏回帰係数は0ではないと考えることができます。
逆に言うと5%(0.05)を超える場合、そのドライバー要因の偏回帰係数は0になる可能性があるため、分析から除外して考えなければいけないことになります。
極端な話、今回の例で考えると、コストパフォーマンスも品質も偏回帰係数が0になる可能性があるため、「推奨度に影響を与えるドライバー要因を選ぶことができませんでした」という結果になりかねないということになります。
さらにやっかいなことに、それぞれの偏回帰係数を比較するためには、データの標準化という作業が必要になります。
この標準化については、例えば、学校のテストの点数について、国語が70点、数学が70点だった時に、両科目は同じくらいの実力ということができるかどうかを考えるとおわかりいただけるかと思います。
国語はほとんどの人が100点で平均点も100点に近く、70点は学年最下位であり、数学はほとんどの人が0点で平均点も0点に近く、70点は学年トップであるような場合、両方70点を取った人の学力は、点数は同じ70点でも、国語力は極めて低く、数学力は極めて高いこととなります。
高校受験や大学受験の際によく使っていた偏差値が、この平均からの距離をもとに国語も数学も同じ尺度に変換して高低を判断する手法だったのです。
重回帰式の偏回帰係数にも、これと同様の処理を施せば偏回帰係数を比較することができます。このようにしてデータを標準化して算出した偏回帰係数のことを標準化偏回帰係数と呼びます。
ここまでの処理をしてはじめて、標準化偏回帰係数をアクションドライバー分析の縦軸として活用することができます
相関係数と標準化偏回帰係数、それぞれのメリット
ここまでお話してきた内容から、アクションドライバー分析の縦軸として相関係数と標準化偏回帰係数を活用することのそれぞれのメリットを整理すると以下のようになります。
<相関係数を活用するメリット>
考え方がシンプルで、経営層や現場に説明しやすい
推奨度に影響を与えると想定したすべての要素の数値を算出できる(重回帰分析の場合、要素が除外される可能性がある)
相関係数はExcelで容易に算出できる(重回帰分析はExcelでも対応可能だが、かなり煩雑)
NPSの登録商標を保有している一社であるサトメトリックス・システムズ(現NICE Systems,Inc)が提供しているNPX ProというNPS調査・分析ツールではアクションドライバーの縦軸に相関係数を採用している
<標準化偏回帰係数を活用するメリット>
推奨度に対する影響度という観点では相関係数よりも正確な数値が算出される
推奨度の予測式が得られるので、ドライバー要因がどのくらい変わると推奨度がどのくらいになるのか、予測することができる
まとめ
一部に難解な内容を含んでしまいましたが、今回お話したかったことは以上です。
NPSは全社的に導入するものなので、理解しやすい相関係数を使用するのがお薦めです。
標準化偏回帰係数は、相関係数よりも正確な数値を算出できますが、理解しにくいことと、ドライバー要因が除外されてしまう可能性があることに注意が必要です。
ではまた次のテーマでお会いしましょう!