2つ以上の変数の相関をみる指標に、相関係数があります。また、それをグラフで表現する方法として、回帰分析があります。
相関係数とは、2つの変数の相関関係を示す指標です。相関係数は必ず-1〜1の範囲に収まり、0.7以上あれば正の相関(片方の値が上がれば、もう片方の値が一定の割合で上がる関係)があると考えられます。
逆に-0.7以下であれば負の相関(片方の値が上がれば、もう片方の値が一定の割合で下がる関係)があるとされています。相関係数が1のときは、2つの変数は完全に正の相関があることになります。逆に-1のときは、2つの変数は完全に負の相関があることになります。
相関係数はエクセルのCORREL関数を用いれば、簡単に求めることができます。下の表の場合は、「相関係数=CORREL(A1:J1
, A2:J2)」となります。
|
A |
B |
C |
D |
E |
F |
G |
H |
I |
J |
1 |
10 |
12 |
3 |
14 |
4 |
10 |
6 |
11 |
9 |
11 |
2 |
16 |
17 |
3 |
26 |
7 |
18 |
10 |
15 |
15 |
14 |
この場合相関係数は0.937でかなり相関が強いことになります。
回帰分析とは、ある原因に対し、結果となる数字がどのような関係を持っているかを調べる際に用います。例えば、原因となる値をXとして、結果となる値をYとすると、次のような式で表すことができます。
Y = a・X + b 、 Y = a・Xb 、 Y = a・eX 、 Y = a・logX
上記の相関係数で使った値をグラフにすると、次のようになります。
ここでR2値とは、ある現象がその回帰式で表される確率というように考えればOKです(したがって、例のグラフの場合9割方は回帰式で説明がつくということになります)。R2値は一般的には、0.5〜0.8なら、回帰式成立の可能性がありそうで、0.8以上ならばかなり成立の可能性が高いことを示します。(直線近似の場合は、R2=相関係数の2乗になります)
1.エクセルで回帰分析をするときは、グラフ上で、近似曲線を追加するを選択します。
2.近似曲線の種類を選びます。
3.「グラフに数式を表示する」と「グラフにR-2乗値を表示する」を追加します。
重回帰分析とは、次の式のように、ある結果となる変数に対して、原因となる変数が2つ以上ある場合に行う回帰分析のことです。
Y = a1・X1 + a2・X2 + a3・X3 + ・・・ + b
行1には、行2と行3の変数からなる関係があるとします。
|
A |
B |
C |
D |
E |
F |
G |
H |
I |
J |
1 |
10 |
12 |
3 |
14 |
4 |
10 |
6 |
11 |
9 |
11 |
2 |
16 |
17 |
3 |
26 |
7 |
18 |
10 |
15 |
15 |
14 |
3 |
10 |
11 |
2 |
15 |
5 |
9 |
6 |
13 |
7 |
14 |
重回帰分析は、エクセルの「ツール」→「分析ツール」の中にある回帰分析を使うと求められます。
ここから、次のような関係が導かれます。
Y = 0.24・X1 + 0.49・X2 + 1.046
重回帰分析では、次の2つの値に注意する必要があります。(いずれも上のやり方で自動的に出てくる数字です)
■t値
t値、エクセルを使って、回帰分析をすると自動的に出てきます。この値が大きい変数は、結果として出てくる変数(例の場合Y)との関係性が強くなります。また、この値が2を超えているかどうかが、原因となる変数(例の場合X)として採用するかどうかの判断材料になります。
■P値
P値も、エクセルと使うと自動的に出てきます。この値が、0.05よりも大きいときは、原因となる変数(例の場合X)として採用しないほうがよいとされています。
また、重回帰分析では、相関の強い変数を2つ以上採用することは避けるべきだと考えられます。例えば、家賃の変数として、駅からの距離と地価を変数にした場合、駅からの距離と地価に強い相関があると、どちらかの数字がt値またはP値の基準がNGになってしまいます。
■分析の前提・次のアクションにつながるかを押さえる
回帰分析は、現象の傾向を表すのに非常に有効なツールです。しかし、回帰分析はやり方次第で、いくらでもそれらしい線を引くことができます。うまく近似曲線をひけたとしても、その近似線で説明できる前提を押さえたり、その近似曲線がわかることで次にどんなアクションにつなげられるかを考えたりすることが非常に重要です。
■相関があるからといって因果関係があるわけではない
回帰分析で高い相関が発見できても、それらに因果関係があるとまでは言い切れないません。実際にグラフに示したみたり、定性的に考えて第3の因子を考えたりすることが重要になります。
■相関から外れたところの扱いに注意
回帰分析をしてグラフを見ると、近似線から明らかに外れたデータが出てくる場合があります。こうしたデータにはビジネス上の大きなヒントが隠されている場合があるので注意して掘り下げてみることも必要です。もちろん単なるノイズとして、データを省ける場合もあります。
■相関の高低の判断はビジネスの種類によって違う
相関があるというためには、相関係数が上述のように一般的に絶対値で0.7くらい(R2値だと0.5くらい)必要ですが、ビジネスの性質によってはそれ以下でも相関関係を深堀して考える場合があります。例えば相関があった場合のリスクが極めて大きい場合などは、相関係数(あるいはR2値)が低くてもしっかり内容を調査していきます。
|
ロジカルシンキング基本思考
論理展開パターン 演繹法
論理展開パターン 帰納法
MECE
ピラミッドストラクチャー
ピラミッドストラクチャー作成1
ピラミッドストラクチャー作成2
フレームワーク思考
仮説思考
問題解決プロセス
相関係数・回帰分析
ファクター分析
コーザリティ分析
マトリックス分析
パレート分析
感度分析
統計の基礎的手法
現象をモデルで考える
ROAツリー
売上高の分解
フレームワーク応用例
ロジカルシンキング例題1
仕事力アップに活用する
交渉の基本概念
|