Next: Functions and Variables for special distributions, Previous: Functions and Variables for inference_result, Up: Top [Contents][Index]
デフォルト値: true
もし stats_numerが trueなら、
推定統計的関数は浮動小数点数で結果を返します。
もし falseなら、
結果は記号と有理フォーマットで与えられます。
これは平均t検定です。
引数 xは1次元標本を含むリストか列行列です。
もしオプション 'asymptoticが trueなら、
中心極限定理に基づいた漸近検定も実行します。
オプション:
'mean, デフォルト 0, はチェックされる平均値です。
'alternative, デフォルト 'twosided, は対立仮説です;
有効な値は次の通りです: 'twosided, 'greater, 'less。
'dev, デフォルト 'unknown, は既知の時の標準偏差値です;
有効な値は次の通りです: 'unknownか正の式。
'conflevel, デフォルト 95/100, は信頼区間の信頼度です;
(0,1)内の値を取る式でなければいけません。
'asymptotic, デフォルト false, は正確確率t検定か、
中心極限定理に基づいた漸近検定かどちらを実行するかを示します;
有効な値は trueと falseです。
関数 test_meanの出力は
以下の結果を示すinference_result Maximaオブジェクトです:
'mean_estimate: 標本平均。
'conf_level: ユーザーが選択した信頼度。
'conf_interval: 母平均の信頼度。
'method: 推定手続き。
'hypotheses: 検定される帰無と対立仮説。
'statistic: 帰無仮説を検定するために使われる標本統計の値。
'distribution: パラメータと合わせて、標本統計分布。
'p_value: 検定のp値
例:
未知の分散で正確確率 t検定を実行します。 片側対立 H_1: mean<50に対して 帰無仮説は H_0: mean=50です; 結果に従うと、p値が大きすぎ、 H_0を却下する証拠がありません。
(%i1) load("stats")$
(%i2) data: [78,64,35,45,45,75,43,74,42,42]$
(%i3) test_mean(data,'conflevel=0.9,'alternative='less,'mean=50);
| MEAN TEST
|
| mean_estimate = 54.3
|
| conf_level = 0.9
|
| conf_interval = [minf, 61.51314273502712]
|
(%o3) | method = Exact t-test. Unknown variance.
|
| hypotheses = H0: mean = 50 , H1: mean < 50
|
| statistic = .8244705235071678
|
| distribution = [student_t, 9]
|
| p_value = .7845100411786889
今回、Maximaは 中心極限定理に基づく漸近検定を実行します。
両側対立 H_1: not equal(mean, 50)に対して
帰無仮説は H_0: equal(mean, 50)です;
結果に従うと、
p値は非常に小さく、
対立 H_1を指示して、H_0は却下すべきです。
. Note that, as indicated by the
Method成分が示すように、
この手続きは多くの標本に適用すべきです。
(%i1) load("stats")$
(%i2) test_mean([36,118,52,87,35,256,56,178,57,57,89,34,25,98,35,
98,41,45,198,54,79,63,35,45,44,75,42,75,45,45,
45,51,123,54,151],
'asymptotic=true,'mean=50);
| MEAN TEST
|
| mean_estimate = 74.88571428571429
|
| conf_level = 0.95
|
| conf_interval = [57.72848600856194, 92.04294256286663]
|
(%o2) | method = Large sample z-test. Unknown variance.
|
| hypotheses = H0: mean = 50 , H1: mean # 50
|
| statistic = 2.842831192874313
|
| distribution = [normal, 0, 1]
|
| p_value = .004471474652002261
これは2つの標本の平均の差 t検定です。
引数 x1と x2は2つの独立標本を含むリストか列行列です。
異なる未知の分散の場合
(以下のオプション 'dev1, 'dev2, 'varequalを参照してください)、
自由度の次数はWelch近似を使って計算されます。
もしオプション 'asymptoticが trueに設定されているなら
中心極限定理に基づく漸近検定も実行します。
オプション:
'alternative, デフォルト 'twosided, は対立仮説です;
有効な値は次の通りです: 'twosided, 'greater, 'less。
'dev1, デフォルト 'unknown,
既知の時、これはx1標本の標準偏差値です;
有効な値は次の通りです: 'unknownもしくは正の式。
'dev2, デフォルト 'unknown,
既知の時、これはx2標本の標準偏差値です;
有効な値は次の通りです: 'unknownもしくは正の式。
'varequal, デフォルト false,
分散を等しいと考えるか等しくないと考えるか;
このオプションは
'dev1と 'dev2の両方もしくはいずれかが 'unknownの時だけ
有効です。
'conflevel, デフォルト 95/100,
信頼区間の信頼度;
(0,1)内の値を取る式でなければいけません。
'asymptotic, デフォルト false,
正確確率 t検定か
中心極限定理に基づく漸近検定どちらを実行するかを示します;
有効な値は trueと falseです。
関数 test_means_differenceの出力は
以下の結果を示すinference_result Maximaオブジェクトです:
'diff_estimate: 平均差推定。
'conf_level: ユーザーが選択した信頼度。
'conf_interval: 平均差の信頼区間。
'method: 推定手続き。
'hypotheses: 検定される帰無、対立仮説。
'statistic: 帰無仮説を検定するのに使われる標本統計値
'distribution: パラメータを伴う標本統計分布。
'p_value: 検定のp値。
例:
母平均 m_1と m_2で対立 H_1: m_1>m_2に対して 2つの小さな標本 x yで平均が等しいか検定します; 分散は未知で異なると仮定されます。
(%i1) load("stats")$
(%i2) x: [20.4,62.5,61.3,44.2,11.1,23.7]$
(%i3) y: [1.2,6.9,38.7,20.4,17.2]$
(%i4) test_means_difference(x,y,'alternative='greater);
| DIFFERENCE OF MEANS TEST
|
| diff_estimate = 20.31999999999999
|
| conf_level = 0.95
|
| conf_interval = [- .04597417812882298, inf]
|
(%o4) | method = Exact t-test. Welch approx.
|
| hypotheses = H0: mean1 = mean2 , H1: mean1 > mean2
|
| statistic = 1.838004300728477
|
| distribution = [student_t, 8.62758740184604]
|
| p_value = .05032746527991905
前と同じ検定、 しかし今回は分散が等しいと仮定されます。
(%i1) load("stats")$
(%i2) x: [20.4,62.5,61.3,44.2,11.1,23.7]$
(%i3) y: matrix([1.2],[6.9],[38.7],[20.4],[17.2])$
(%i4) test_means_difference(x,y,'alternative='greater,
'varequal=true);
| DIFFERENCE OF MEANS TEST
|
| diff_estimate = 20.31999999999999
|
| conf_level = 0.95
|
| conf_interval = [- .7722627696897568, inf]
|
(%o4) | method = Exact t-test. Unknown equal variances
|
| hypotheses = H0: mean1 = mean2 , H1: mean1 > mean2
|
| statistic = 1.765996124515009
|
| distribution = [student_t, 9]
|
| p_value = .05560320992529344
これは分散 chi^2検定です。 引数 xは 正規母集団から取られた1次元標本を含む リストか列行列です。
オプション:
'mean, デフォルト 'unknown,
は、既知の時、母平均です。
'alternative, デフォルト 'twosided,
対立仮説です;
有効な値は次の通りです: 'twosided, 'greater, 'less.
'variance, デフォルト 1,
これはチェックされる分散値(正)です。
'conflevel, デフォルト 95/100,
信頼区間の信頼度;
(0,1)内の値を取る式でなければいけません。
関数 test_varianceの出力は
以下の結果を示すinference_result Maximaオブジェクトです:
'var_estimate: 標本分散。
'conf_level: ユーザーが選択した信頼度。
'conf_interval: 母分散の信頼区間。
'method: 推定手続き。
'hypotheses: 検定される帰無、対立仮説。
'statistic: 帰無仮説を検定するのに使う標本統計値。
'distribution: パラメータを伴う標本統計分布。
'p_value: 検定の p値。
例:
平均が未知の母集団の分散が200以上か検定します。
(%i1) load("stats")$
(%i2) x: [203,229,215,220,223,233,208,228,209]$
(%i3) test_variance(x,'alternative='greater,'variance=200);
| VARIANCE TEST
|
| var_estimate = 110.75
|
| conf_level = 0.95
|
| conf_interval = [57.13433376937479, inf]
|
(%o3) | method = Variance Chi-square test. Unknown mean.
|
| hypotheses = H0: var = 200 , H1: var > 200
|
| statistic = 4.43
|
| distribution = [chi2, 8]
|
| p_value = .8163948512777689
これは2つの正規母集団の分散比 F検定です。 引数 x1と x2は 2つの独立標本を含むリストか列行列です。
オプション:
'alternative, デフォルト 'twosided,
は対立仮説です;
有効な値は次の通りです: 'twosided, 'greater, 'less.
'mean1, デフォルト 'unknown,
既知の時、これはx1が取られた母集団の平均です。
'mean2, デフォルト 'unknown,
既知の時、これはx2が取られた母集団の平均です。
'conflevel, デフォルト 95/100,
比の信頼区間の信頼度;
(0,1)内の値を取る式でなければいけません。
関数 test_variance_ratioの出力は
以下の結果を示すinference_result Maximaオブジェクトです:
'ratio_estimate: 標本分散比。
'conf_level: ユーザーが選択した信頼度。
'conf_interval: 分散比の信頼区間。
'method: 推定手続き。
'hypotheses: 検定される帰無、対立仮説。
'statistic: 帰無仮説を検定するのに使われる標本統計値。
'distribution: パラメータを伴う標本統計分布。
'p_value: 検定のp値。
例:
前者が後者より大きいという対立仮説に対して、 2つの正規母集団の分散の等しさが
(%i1) load("stats")$
(%i2) x: [20.4,62.5,61.3,44.2,11.1,23.7]$
(%i3) y: [1.2,6.9,38.7,20.4,17.2]$
(%i4) test_variance_ratio(x,y,'alternative='greater);
| VARIANCE RATIO TEST
|
| ratio_estimate = 2.316933391522034
|
| conf_level = 0.95
|
| conf_interval = [.3703504689507268, inf]
|
(%o4) | method = Variance ratio F-test. Unknown means.
|
| hypotheses = H0: var1 = var2 , H1: var1 > var2
|
| statistic = 2.316933391522034
|
| distribution = [f, 5, 4]
|
| p_value = .2179269692254457
出現率推定。 引数 xは 未知の確率でのBernoulli実験のn回試行での成功回数です。
オプション:
'proportion, デフォルト 1/2,
はチェックされる出現率の値です。
'alternative, デフォルト 'twosided,
は対立仮説です;
有効な値は次の通りです: 'twosided, 'greater, 'less.
'conflevel, デフォルト 95/100,
比の信頼区間の信頼度;
(0,1)内の値を取る式でなければいけません。
'asymptotic, デフォルト false,
二項分布に基づく正確確率 t検定か
中心極限定理に基づく漸近検定どちらを実行するかを示します;
有効な値は trueと falseです。
'correct, デフォルト true,
Yates補正が適用されるかどうかを示します。
The output of function
関数 test_proportionの出力は
以下の結果を示す
inference_result Maximaオブジェクトです:
'sample_proportion: 標本出現率。
'conf_level: ユーザーが選択した信頼度。
'conf_interval: 出現率のWilson信頼区間。
'method: 推定手続き。
'hypotheses: 検定される帰無、対立仮説。
'statistic: 帰無仮説を検定するのに使われる標本統計値。
'distribution: パラメータを伴う標本統計分布。
'p_value: 検定のp値。
例:
正確確率検定を実行します。 片側対立 H_1: p<1/2に対して、 帰無仮説は H_0: p=1/2です。
(%i1) load("stats")$
(%i2) test_proportion(45, 103, alternative = less);
| PROPORTION TEST
|
| sample_proportion = .4368932038834951
|
| conf_level = 0.95
|
| conf_interval = [0, 0.522714149150231]
|
(%o2) | method = Exact binomial test.
|
| hypotheses = H0: p = 0.5 , H1: p < 0.5
|
| statistic = 45
|
| distribution = [binomial, 103, 0.5]
|
| p_value = .1184509388901454
両側漸近検定。信頼度は99/100です。
(%i1) load("stats")$
(%i2) fpprintprec:7$
(%i3) test_proportion(45, 103,
conflevel = 99/100, asymptotic=true);
| PROPORTION TEST
|
| sample_proportion = .43689
|
| conf_level = 0.99
|
| conf_interval = [.31422, .56749]
|
(%o3) | method = Asympthotic test with Yates correction.
|
| hypotheses = H0: p = 0.5 , H1: p # 0.5
|
| statistic = .43689
|
| distribution = [normal, 0.5, .048872]
|
| p_value = .19662
2つの出現率の差の推定。 引数 x1は 一番目の母集団でのBernoulli実験の n1回の試行での成功回数であり、 x2と n2は 二番目の母集団での対応する値です。 標本は独立で、検定は漸近です。
オプション:
'alternative, デフォルト 'twosided,
は対立仮説です;
有効な値は次の通りです: 'twosided (p1 # p2), 'greater (p1 > p2), 'less (p1 < p2).
'conflevel, デフォルト 95/100,
比の信頼区間の信頼度;
(0,1)内の値を取る式でなければいけません。
'correct, デフォルト true,
はYates補正が適用されるかどうかを示します。
関数 test_proportions_differenceの出力は
以下の結果を示す
inference_result Maximaオブジェクトです:
'proportions: 2つの標本出現率のリスト。
'conf_level: ユーザーが選択した信頼度。
'conf_interval: 出現率の差 p1 - p2の信頼区間。
'method: 推定手続きと
標本サイズのいずれかが10より小さい場合の警告メッセージ
'hypotheses: 検定される帰無、対立仮説。
'statistic: 帰無仮説を検定するのに使われる標本統計値。
'distribution: パラメータを伴う標本統計分布。
'p_value: 検定のp値。
例:
機械が250個のうち、10個の欠陥製品を製造しました。
その機械は、ある保守作業のあと、
150個のうち、4個の欠陥製品を製造しました。
機械が改善したか知るために、
対立 H0:p1>p2に対して
帰無仮説 H0:p1=p2を検定します。
ここで、
p1と p2は
保守の前と後で製造された製品が欠陥である確率です。
p値に従うと、対立を受け入れる十分な証拠はありません。
(%i1) load("stats")$
(%i2) fpprintprec:7$
(%i3) test_proportions_difference(10, 250, 4, 150,
alternative = greater);
| DIFFERENCE OF PROPORTIONS TEST
|
| proportions = [0.04, .02666667]
|
| conf_level = 0.95
|
| conf_interval = [- .02172761, 1]
|
(%o3) | method = Asymptotic test. Yates correction.
|
| hypotheses = H0: p1 = p2 , H1: p1 > p2
|
| statistic = .01333333
|
| distribution = [normal, 0, .01898069]
|
| p_value = .2411936
データが未知の時の漸近正規分布の正確確率標準偏差。
(%i1) load("stats")$
(%i2) stats_numer: false$
(%i3) sol: test_proportions_difference(x1,n1,x2,n2)$
(%i4) last(take_inference('distribution,sol));
1 1 x2 + x1
(-- + --) (x2 + x1) (1 - -------)
n2 n1 n2 + n1
(%o4) sqrt(---------------------------------)
n2 + n1
これは連続母集団のメジアンに関するノンパラメトリック符号検定です。 引数 xは1次元標本を含むリストか列行列です。
オプション:
'alternative, デフォルト 'twosided,
は対立仮説です;
有効な値は次の通りです: 'twosided, 'greater, 'less.
'median, デフォルト 0, はチェックされるメジアン値です。
関数 test_signの出力は
以下の結果を示す
inference_result Maximaオブジェクトです:
'med_estimate: 標本メジアン。
'method: 推定手続き。
'hypotheses: 検定される帰無、対立仮説。
'statistic: 帰無仮説を検定するのに使われる標本統計値。
'distribution: パラメータを伴う標本統計分布。
'p_value: 検定のp値。
例:
対立 H_1: median > 6に対して、 標本が採られた母集団がメジアン6を持つかどうかチェックします。
(%i1) load("stats")$
(%i2) x: [2,0.1,7,1.8,4,2.3,5.6,7.4,5.1,6.1,6]$
(%i3) test_sign(x,'median=6,'alternative='greater);
| SIGN TEST
|
| med_estimate = 5.1
|
| method = Non parametric sign test.
|
(%o3) | hypotheses = H0: median = 6 , H1: median > 6
|
| statistic = 7
|
| distribution = [binomial, 10, 0.5]
|
| p_value = .05468749999999989
これは 連続母集団のメジアンに関する推定を行う Wilcoxonの符号順位検定です。 引数 xは 1次元標本を含む リストか列行列です。 もし標本サイズが20より大きいか、複数の零すなわち引き分けがあれば、 正規近似を実行します
pdf_rank_testと cdf_rank_testも参照してください。
オプション:
'median, デフォルト 0,
はチェックされるメジアン値です。
'alternative, デフォルト 'twosided,
は対立仮説です;
有効な値は次の通りです: 'twosided, 'greater and 'less.
関数 test_signed_rankの出力は
以下の結果を持つ
inference_result Maximaオブジェクトです:
'med_estimate: 標本メジアン。
'method: 推定手続き。
'hypotheses: 検定される帰無、対立仮説。
'statistic: 帰無仮説を検定するのに使われる標本統計値。
'distribution: パラメータを伴う標本統計分布。
'p_value: 検定のp値。
例:
対立 H_1: median > 15に対して 帰無仮説 H_0: median = 15をチェックします。 引き分けがないので、これは正確確率検定です。
(%i1) load("stats")$
(%i2) x: [17.1,15.9,13.7,13.4,15.5,17.6]$
(%i3) test_signed_rank(x,median=15,alternative=greater);
| SIGNED RANK TEST
|
| med_estimate = 15.7
|
| method = Exact test
|
(%o3) | hypotheses = H0: med = 15 , H1: med > 15
|
| statistic = 14
|
| distribution = [signed_rank, 6]
|
| p_value = 0.28125
Checks the null hypothesis H_0: equal(median, 2.5) against the alternative H_1: not equal(median, 2.5). This is an approximated test, since there are ties.
(%i1) load("stats")$
(%i2) y:[1.9,2.3,2.6,1.9,1.6,3.3,4.2,4,2.4,2.9,1.5,3,2.9,4.2,3.1]$
(%i3) test_signed_rank(y,median=2.5);
| SIGNED RANK TEST
|
| med_estimate = 2.9
|
| method = Asymptotic test. Ties
|
(%o3) | hypotheses = H0: med = 2.5 , H1: med # 2.5
|
| statistic = 76.5
|
| distribution = [normal, 60.5, 17.58195097251724]
|
| p_value = .3628097734643669
これは 2つの連続母集団のメジアンを比較するWilcoxon-Mann-Whitney検定です。 最初の2つの引数 x1と x2は 2つの独立標本のデータを持つリストか列行列です。 もし標本サイズのいずれかが10より大きいか、 引き分けがあるなら、 正規近似を実行します。
オプション:
'alternative, デフォルト 'twosided,
は対立仮説です;
有効な値は次の通りです: 'twosided, 'greater and 'less.
The output of function
関数 test_rank_sumの出力は
以下の結果を持つ
inference_result Maximaオブジェクトです:
'method: 推定手続き。
'hypotheses: 検定される帰無、対立仮説。
'statistic: 帰無仮説を検定するのに使われる標本統計値。
'distribution: パラメータを伴う標本統計分布。
'p_value: 検定のp値。
例:
母集団が似たメジアンを持つかチェックします。 標本サイズは小さく、正確確率検定がされます。
(%i1) load("stats")$
(%i2) x:[12,15,17,38,42,10,23,35,28]$
(%i3) y:[21,18,25,14,52,65,40,43]$
(%i4) test_rank_sum(x,y);
| RANK SUM TEST
|
| method = Exact test
|
| hypotheses = H0: med1 = med2 , H1: med1 # med2
(%o4) |
| statistic = 22
|
| distribution = [rank_sum, 9, 8]
|
| p_value = .1995886466474702
次は、 より大きな標本で引き分けを含み、 手続きは正規近似をします。 対立仮説は H_1: median1 < median2です。
(%i1) load("stats")$
(%i2) x: [39,42,35,13,10,23,15,20,17,27]$
(%i3) y: [20,52,66,19,41,32,44,25,14,39,43,35,19,56,27,15]$
(%i4) test_rank_sum(x,y,'alternative='less);
| RANK SUM TEST
|
| method = Asymptotic test. Ties
|
| hypotheses = H0: med1 = med2 , H1: med1 < med2
(%o4) |
| statistic = 48.5
|
| distribution = [normal, 79.5, 18.95419580097078]
|
| p_value = .05096985666598441
正規性のShapiro-Wilk検定。
引数 xは
数のリストであり、
標本サイズは2より大きく、5000以下でなければいけません。
そうでないなら、関数 test_normalityはエラーメッセージをシグナルします。
参考文献:
[1] Algorithm AS R94, Applied Statistics (1995), vol.44, no.4, 547-551
関数 test_normalityの出力は
以下の結果を持つ
inference_result Maximaオブジェクトです:
'statistic: W統計値
'p_value: 正規仮定のp値。
例:
サイズ9の標本に基づいて母集団の正規性をチェックします。
(%i1) load("stats")$
(%i2) x:[12,15,17,38,42,10,23,35,28]$
(%i3) test_normality(x);
| SHAPIRO - WILK TEST
|
(%o3) | statistic = .9251055695162436
|
| p_value = .4361763918860381
単回帰 y_i=a+b x_i+e_i。 ここで、 e_iは N(0,sigma)の独立確率変数です 引数 xは2つの列行列か対のリストでなければいけません。
オプション:
'conflevel, デフォルト 95/100,
比の信頼区間の信頼度;
(0,1)内の値を取る式でなければいけません。
'regressor, デフォルト 'x,
独立変数名。
関数 simple_linear_regressionの出力は
以下の結果を持つ
inference_result Maximaオブジェクトです:
'model: 適合方程式。
新しい予測を行うのに役立ちます。
以下の例を参照してください。
'means: 二変量平均。
'variances: 両方の変数の分散。
'correlation: 相関係数。
'adc: 調整済み決定係数。
'a_estimation: パラメータ aの推定。
'a_conf_int: パラメータ aの信頼区間。
'b_estimation: パラメータ bの推定。
'b_conf_int: パラメータ bの信頼区間。
'hypotheses: パラメータ bについて検定される帰無、対立仮説。
'statistic: 帰無仮説を検定するのに使われる標本統計値。
'distribution: パラメータを伴う標本統計分布。
'p_value: bについての検定のp値。
'v_estimation: 不偏分散推定もしくは残差分散。
'v_conf_int: 分散信頼区間。
'cond_mean_conf_int: 条件付き平均の信頼区間。
以下の例を参照してください。
'new_pred_conf_int: 新しい予測の信頼区間。
以下の例を参照してください。
'residuals: 予測に関して並べ替えられた対(予測, 残差)のリスト
これは適合度分析に役に立ちます。
以下の例を参照してください。
Only items
上の項目 1, 4, 14, 9, 10, 11, 12, 13だけが
この順で、デフォルトで表示されます。
残りは
ユーザーが関数 items_inferenceと take_inferenceを利用するまで
隠されたままです。
例:
線形モデルの二変量標本へのフィッティング。
入力 %i4は
回帰線と一緒に標本をプロットします;
入力 %i5は
x=113が与えられたとして
yを計算します;
x=113の時
平均と、新しい予測の信頼区間も計算されます。
(%i1) load("stats")$
(%i2) s:[[125,140.7], [130,155.1], [135,160.3], [140,167.2],
[145,169.8]]$
(%i3) z:simple_linear_regression(s,conflevel=0.99);
| SIMPLE LINEAR REGRESSION
|
| model = 1.405999999999985 x - 31.18999999999804
|
| correlation = .9611685255255155
|
| v_estimation = 13.57966666666665
|
(%o3) | b_conf_int = [.04469633662525263, 2.767303663374718]
|
| hypotheses = H0: b = 0 ,H1: b # 0
|
| statistic = 6.032686683658114
|
| distribution = [student_t, 3]
|
| p_value = 0.0038059549413203
(%i4) plot2d([[discrete, s], take_inference(model,z)],
[x,120,150],
[gnuplot_curve_styles, ["with points","with lines"]] )$
(%i5) take_inference(model,z), x=133;
(%o5) 155.808
(%i6) take_inference(means,z);
(%o6) [135.0, 158.62]
(%i7) take_inference(new_pred_conf_int,z), x=133;
(%o7) [132.0728595995113, 179.5431404004887]
Next: Functions and Variables for special distributions, Previous: Functions and Variables for inference_result, Up: Top [Contents][Index]