topimg.jpg


SPSSで重回帰分析をしてみる

【重回帰分析での注意点:多重共線性】
説明変数間に相関性がある場合(互いに独立でない場合)、不本意な重回帰結果が得られることがある(多重共線性)。
具体的には、偏回帰係数の符号と、説明変数と目的変数の単相関係数の符号が一致しない、といった現象が起こる。
このような場合、以下の観点に従って、説明変数の一方を減らすといった対処が必要である。


(1)目的変量に与える影響の大きい説明変量を選ぶ。各説明変量と目的変量間の単相関係数を求めて、各説明変量の目的変数に与える影響の大きさを調べる。
(2)説明変量間で高い相関が認められるときには、どちらか一方の変量を落として重回帰式を作成する。一般に説明変量間の単相関係数が0.9以上ある時にはどちらか一方の説明変量を落とす。特に説明変量間で単相関係数≒1の時には偏回帰係数を求めることができない。
(3)偏回帰係数≒0となるような説明変量は、役にたたない変量であるから落とすようにする。

引用元
EXCELを使った多変量解析 
1.9 良い重回帰式を作成する 
http://gucchi24.hp.infoseek.co.jp/MRA2.htm


このような説明変数の取捨選択を、下記アルゴリズムに従って計算する。
 
・強制投入法(すべての変数を説明変数として重回帰式を作る。あまり実用的でない)
・変数増加法(既存の重回帰式に、新たな変数を追加していく)
・変数減少法(既存の重回帰式から、変数を減少させていく)
・ステップワイズ法(変数増減法。一般的によく用いられる手法)

とりあえず、説明変数が未確定のときはステップワイズ法を使えばいいと思う。



【SPSSで重回帰分析を行う】
①SPSS評価版のダウンロード(まずこいつがなくては始まらない)
http://spss.jp.brothersoft.com/?utm_source=yahoo-answer&utm_medium=fenghua&utm_campaign=jp
※英語版。日本語版がほしい・・・

②SPSS Statistics 17.0を起動する

③必要なデータを投入

④Analyze(分析)>Regression(回帰)>Liner(線形)を選択

⑤Dependent(従属変数)、Independent(s)(独立変数)に、分析対象の列項目を投入する。

⑥Statistics(統計)ボタン押下後、Colinearity diagnostics(共線性の診断)にチェックを入れる

⑦OKボタンを押下

⑧結果の分析
以下の観点で確認をする。
・Variables Entered/Removeda(投入済み変数または除去された変数)でモデルが複数ある場合は、基本的に一番下のものを確認する・Model Summary(モデル集計)でR2乗値の値を確認する。値が1に近ければ近いほど、そのモデル式が目的変数を良く説明できていると言える。昔教授がここの値が6割超えていたらまあモデルが当てはまっている見ていいと言っていた。
・ANOVA(分散分析)で、Sig.(有意確率)の値を確認する。0に近ければ近いほど有意差があるといえる。通常は、有意確率0.05%基準で見るため、これ以下に収まっていればよい。
・Coefficients(係数)で、Unstandardized Coefficients(非標準化係数)のB値を確認する。これが偏回帰係数にあたる。
・Coefficients(係数)で、Standardized Coefficients(標準化係数)のBeta値を確認する。これが標準回帰係数(各説明変数の寄与率)にあたる。
・Collinearity Diagnosticsa(共線性の診断)で、Variance Proportions(分散の比率)を確認する。1に近い説明変数変数が複数見つかった場合、多重共線性が発生している可能性があるので、一部説明変数を除去して再分析する必要がある。



参考
多変量解析の基礎知識:
http://vi.macromill.com/method/d01.html
EXCELを使った多変量解析
http://gucchi24.hp.infoseek.co.jp/index.htm
★SPSSで重回帰分析を行う
http://www.u-gakugei.ac.jp/~kishilab/spss-mra.htm
スポンサーサイト
  1. 2010/09/05(日) 08:18:21|
  2. 統計
  3. | トラックバック:1
  4. | コメント:2
<<IS01で英字の自動大文字変換を解除する | ホーム | 代表的な多変量解析>>

コメント

>通常は、有意確率0.05%基準で見るため、これ以下に収まっていればよい。

結果の時に出る有意確率の単位は%ではないです。普通はこの有意確率に100をかけたものが%となるはずですが・・・。0.05の場合、5%水準で有意であったと書くのが普通ではないでしょうか?
  1. 2010/12/10(金) 12:33:13 |
  2. URL |
  3. #-
  4. [ 編集 ]

そうですね、おっしゃる通り「有意確率5%」が正しい表記です。ただし、SPSSで確認するときは0.05を基準にしてみるということですね。ご指摘ありがとうございました。
  1. 2010/12/11(土) 21:52:22 |
  2. URL |
  3. #-
  4. [ 編集 ]

コメントの投稿


管理者にだけ表示を許可する

トラックバック

トラックバック URL
http://192168111.blog71.fc2.com/tb.php/46-c380139c
この記事にトラックバックする(FC2ブログユーザー)

よくわかるマスター MCAS Excel 2007完全マスターI  公認テキスト |富士通エフ・オー・エム

よくわかるマスター MCAS Excel 2007完全マスターI  公認テキスト...
  1. 2010/09/10(金) 08:51:42 |
  2. ベストアンサー