宣伝効果の検証(回帰分析編)
ある会社がローカル紙に1週間広告を掲載し、その週の売上を記録したとします。
まずは試しに5回実施しました。どうやって効果を検証したらいいでしょうか。
データ:
Sales ($1,000s) |
Ad Budget ($100s) |
11 | 5 |
6 | 3 |
10 | 7 |
6 | 2 |
12 | 8 |
つぎのようにliner-regressionで求めていきます。
ŷ = a + bx
where
ŷ = value of the dependent variable
a = y-axis intercept
b = slope of the regression line
x = independent variable
計算メモ:
Sales, y | Advertising, x | x² | xy |
11 | 5 | 25 | 55 |
6 | 3 | 9 | 18 |
10 | 7 | 49 | 70 |
6 | 2 | 4 | 12 |
12 | 8 | 64 | 96 |
Σy=45 | Σx=25 | Σx²=151 | Σxy=251 |
y̅=45/5=9 | x̅=25/5=5 |
aとbは、以下の式を使って求めることができます。
b = (Σxy - nx̅y̅)/(Σx² - nx̅²) = (251 -5*9*5)/(151 - 5*5^2)= 1
a = y̅ - bx̅ = 9 - 1*5 = 4
ŷ = a + bx = 4 + 1x となります。
つまりxの値が1ユニット($100)増えると、売上も1ユニット($1,000)増えることを意味します。グラフにするとこんな感じになります。
最後に相関係数(そうかんけいすう、correlation coefficient)を求めます。
2つの確率変数の間にある線形な関係の強弱を測る指標であり、-1や1に近ければ、
相関性が高いと言えます。
では、実際に計算してみましょう。
rは、次の式で求めることができます。
r = (nΣxy - ΣxΣy)/(√([nΣx² - (Σx)²][nΣy² - (Σy)²])
(nΣxy - ΣxΣy) = 130
([nΣx² - (Σx)²][nΣy² - (Σy)²]) = 20800
sqrt(20800) = 144.2221
r = 130/144.2221 = 0.901388
エクセルで=CORREL()関数を使うと上記の計算が簡単にできます。
r = 0.901なのでかなり相関関係があると言えるでしょう。
R² = (0.901388)^2 = 0.8125 となります。
ちなみにR²は決定係数(けっていけいすう、coefficient of determination)です。
独立変数(説明変数)が従属変数(被説明変数)のどれくらいを説明できるかを表す値です。
捕捉:相関係数が0のとき確率変数は無相関であるといえます。