宣伝効果の検証(回帰分析編)

ある会社がローカル紙に1週間広告を掲載し、その週の売上を記録したとします。
まずは試しに5回実施しました。どうやって効果を検証したらいいでしょうか。

データ:

Sales ($1,000s)

Ad Budget ($100s)
11 5
6 3
10 7
6 2
12 8

 

つぎのようにliner-regressionで求めていきます。

ŷ = a + bx
where
ŷ = value of the dependent variable
a = y-axis intercept
b = slope of the regression line
x = independent variable

  

計算メモ:

Sales, y Advertising, x xy
11 5 25 55
6 3 9 18
10 7 49 70
6 2 4 12
12 8 64 96
Σy=45 Σx=25 Σx²=151 Σxy=251
y̅=45/5=9 x̅=25/5=5    

 

aとbは、以下の式を使って求めることができます。

b = (Σxy - nx̅y̅)/(Σx² - nx̅²) = (251 -5*9*5)/(151 - 5*5^2)= 1
a = y̅ - bx̅ = 9 - 1*5 = 4

ŷ = a + bx = 4 + 1x  となります。

 

つまりxの値が1ユニット($100)増えると、売上も1ユニット($1,000)増えることを意味します。グラフにするとこんな感じになります。

 f:id:shinji629:20180614115644p:plain

 

最後に相関係数(そうかんけいすう、correlation coefficient)を求めます。
2つの確率変数の間にある線形な関係の強弱を測る指標であり、-1や1に近ければ、
相関性が高いと言えます。

では、実際に計算してみましょう。

rは、次の式で求めることができます。

r = (nΣxy - ΣxΣy)/(√([nΣx² - (Σx)²][nΣy² - (Σy)²])

(nΣxy - ΣxΣy) = 130
([nΣx² - (Σx)²][nΣy² - (Σy)²]) = 20800
sqrt(20800) = 144.2221
r = 130/144.2221 = 0.901388

エクセルで=CORREL()関数を使うと上記の計算が簡単にできます。

r = 0.901なのでかなり相関関係があると言えるでしょう。

R² = (0.901388)^2 = 0.8125 となります。

ちなみにR²は決定係数(けっていけいすう、coefficient of determination)です。
独立変数(説明変数)が従属変数(被説明変数)のどれくらいを説明できるかを表す値です。

 

捕捉:相関係数が0のとき確率変数は無相関であるといえます。