topimg.jpg


統計小ネタ①

●標準偏差(SD)と標準誤差(SE)
・標準偏差→データのバラつき度を示す指標
・標準誤差→求めたデータの平均値から推定されるズレ幅を示す指標
参考
http://rockymuku.sakura.ne.jp/kousyuueisei/SDtoSEtoCI.pdf


●分布
・正規分布→標本の平均値検定に利用。分散が真の値(標本数が多い場合(約30以上))。
・t分布→標本の平均値検定に利用。分散が推定値(標本数が少ない場合(約30未満))。
・χ二乗分布→標本の分散検定に利用(適合性の検定、独立性の検定)。分散が既知。
・F分布→標本の分散検定に利用(適合性の検定、独立性の検定)。分散が未知。
参考
http://www012.upp.so-net.ne.jp/doi/biostat/CT39/distribution.pdf
http://www.geisya.or.jp/~mwm48961/statistics/kai2.htm
スポンサーサイト
  1. 2012/01/09(月) 07:11:47|
  2. 統計
  3. | トラックバック:0
  4. | コメント:0

【ドル円】ロングとショートの成功率

ドル円のロング・ショートの成功率を調査してみた。

●定義
成功率とは、
ロング(ショート)のポジションを保持してからA日以内に、
保持した時のレートからBpips上回っている(下回っている)
確率

下表では、
Aの値→(期間)
Bの値→(pips)

image005.png

たとえば、ロングの、期間=1day、pips=10の場合、成功率は79%になっている。
これは、
ロングのポジションを保持してから1日以内に、
保持した時のレートから10pips上回っている確率が79%であることを意味している。

つまり、何の考えもなしに、任意の時間に、リミット+10pipsにして1日ほっとけば、79%の確率で約定されるということだ。


上記表を、グラフ化したものを一応以下に示しておく。

image001.png

image003.png


まあ、だからなんだって話だが、これを使って儲ける必勝パターンを編み出すのだ。
  1. 2011/06/08(水) 03:38:47|
  2. 統計
  3. | トラックバック:0
  4. | コメント:0

SPSSで重回帰分析をしてみる

【重回帰分析での注意点:多重共線性】
説明変数間に相関性がある場合(互いに独立でない場合)、不本意な重回帰結果が得られることがある(多重共線性)。
具体的には、偏回帰係数の符号と、説明変数と目的変数の単相関係数の符号が一致しない、といった現象が起こる。
このような場合、以下の観点に従って、説明変数の一方を減らすといった対処が必要である。


(1)目的変量に与える影響の大きい説明変量を選ぶ。各説明変量と目的変量間の単相関係数を求めて、各説明変量の目的変数に与える影響の大きさを調べる。
(2)説明変量間で高い相関が認められるときには、どちらか一方の変量を落として重回帰式を作成する。一般に説明変量間の単相関係数が0.9以上ある時にはどちらか一方の説明変量を落とす。特に説明変量間で単相関係数≒1の時には偏回帰係数を求めることができない。
(3)偏回帰係数≒0となるような説明変量は、役にたたない変量であるから落とすようにする。

引用元
EXCELを使った多変量解析 
1.9 良い重回帰式を作成する 
http://gucchi24.hp.infoseek.co.jp/MRA2.htm


このような説明変数の取捨選択を、下記アルゴリズムに従って計算する。
 
・強制投入法(すべての変数を説明変数として重回帰式を作る。あまり実用的でない)
・変数増加法(既存の重回帰式に、新たな変数を追加していく)
・変数減少法(既存の重回帰式から、変数を減少させていく)
・ステップワイズ法(変数増減法。一般的によく用いられる手法)

とりあえず、説明変数が未確定のときはステップワイズ法を使えばいいと思う。



【SPSSで重回帰分析を行う】
①SPSS評価版のダウンロード(まずこいつがなくては始まらない)
http://spss.jp.brothersoft.com/?utm_source=yahoo-answer&utm_medium=fenghua&utm_campaign=jp
※英語版。日本語版がほしい・・・

②SPSS Statistics 17.0を起動する

③必要なデータを投入

④Analyze(分析)>Regression(回帰)>Liner(線形)を選択

⑤Dependent(従属変数)、Independent(s)(独立変数)に、分析対象の列項目を投入する。

⑥Statistics(統計)ボタン押下後、Colinearity diagnostics(共線性の診断)にチェックを入れる

⑦OKボタンを押下

⑧結果の分析
以下の観点で確認をする。
・Variables Entered/Removeda(投入済み変数または除去された変数)でモデルが複数ある場合は、基本的に一番下のものを確認する・Model Summary(モデル集計)でR2乗値の値を確認する。値が1に近ければ近いほど、そのモデル式が目的変数を良く説明できていると言える。昔教授がここの値が6割超えていたらまあモデルが当てはまっている見ていいと言っていた。
・ANOVA(分散分析)で、Sig.(有意確率)の値を確認する。0に近ければ近いほど有意差があるといえる。通常は、有意確率0.05%基準で見るため、これ以下に収まっていればよい。
・Coefficients(係数)で、Unstandardized Coefficients(非標準化係数)のB値を確認する。これが偏回帰係数にあたる。
・Coefficients(係数)で、Standardized Coefficients(標準化係数)のBeta値を確認する。これが標準回帰係数(各説明変数の寄与率)にあたる。
・Collinearity Diagnosticsa(共線性の診断)で、Variance Proportions(分散の比率)を確認する。1に近い説明変数変数が複数見つかった場合、多重共線性が発生している可能性があるので、一部説明変数を除去して再分析する必要がある。



参考
多変量解析の基礎知識:
http://vi.macromill.com/method/d01.html
EXCELを使った多変量解析
http://gucchi24.hp.infoseek.co.jp/index.htm
★SPSSで重回帰分析を行う
http://www.u-gakugei.ac.jp/~kishilab/spss-mra.htm
  1. 2010/09/05(日) 08:18:21|
  2. 統計
  3. | トラックバック:1
  4. | コメント:2

代表的な多変量解析

久々の更新。


ひょんなことから、大学時代にやってた統計の勉強を少ししたので、その覚書。


【基礎用語】
●変数
・目的変数
 =従属変数。Y
・説明変数
 =独立変数。X1,X2・・・
・観測変数
 実際に測定された変数
・潜在変数
 実際に観測されていない仮定の変数(因子)

●多変量解析
①主成分分析(Principal Compotent Analysis;PCA)
多変量データを統合し、新たな統合指標を作り出す手法。
下記例でいうと、Zが潜在変数、Xが観測変数。Z,a,b,cを導き出すのが主成分分析。
Z1=aX1 + bX2 + cX3
参考
リサーチソリューション マクロミル:主成分分析
http://vi.macromill.com/method/d05.html
②因子分析(Factor Analysis;FA)
多変量データに存在する共通因子を探るための手法。
下記例でいうと、Zが潜在変数、Xが観測変数。Z,a,b,cを導き出すのが因子分析。
X1=aZ1 + bZ2 + cZ3
参考
リサーチソリューション マクロミル:主成分分析
http://vi.macromill.com/method/d06.html
③重回帰分析(Multiple Regression Analysis;MRA)
複数の説明変数で1つの目的変数を予測するための相関性を算出する手法。
下記例でいうと、Yが目的変数、Xが説明変数。a,b,cを導き出すのが重回帰分析。
Y=aX1 + bX2 + cX3
参考
リサーチソリューション マクロミル:回帰分析
http://vi.macromill.com/method/d04.html
  1. 2010/09/05(日) 06:49:33|
  2. 統計
  3. | トラックバック:0
  4. | コメント:0