R言語の2標本t検定のテンプレートファイルを紹介します。
t検定のスクリプトファイルは以下のgithubまたは、ダウンロードリンクより入手できます。
t検定の実行したいときのテンプレートファイルとして使っていただいて問題ないです。
R言語 2標本t検定テンプレートスクリプト
使い方
紹介するテンプレートファイルの使い方について見ていきます。
テンプレートファイルは以下の構成になっています。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 | fileName <- "2標本t検定データセット.csv" alternative <- "two.sided" #両側検定: "two.sided", 左片側検定: "less", 右片側検定: "greater") varEqual <- TRUE confLevel <- 0.95 dataset <- read.csv(fileName) testResult <- t.test(dataset[, 1], dataset[, 2], alternative = alternative, var.equal = varEqual, conf.level = confLevel) resultDataFrame <- data.frame(testResult$statistic, testResult$estimate[1], testResult$estimate[2], testResult$conf.int[1], testResult$conf.int[2], testResult$p.value, row.names = NULL) colnames(resultDataFrame) <- c("statistic", paste("sample.mean of " , colnames(dataset)[1]), paste("sample.mean of " , colnames(dataset)[2]), "upper conf.tnt of mean difference", "lower conf.tnt of mean difference", "p.value") write.csv(resultDataFrame, "2標本t検定結果.csv", row.names = FALSE,) |
基本的にソースコードの上の変数にパラメータをセットするだけで2標本t検定を簡単に実行することができます。
特にRの知識が無くても実行できるようなスクリプトになっています。
続いてパラメータについて紹介します。
テンプレートファイルのパラメータは以下の通りです。
fileName | データセットのファイル名。 |
alternative | 検定の種類。"two.sided"で両側検定、"less"で左片側検定、"greater"で右片側検定。 |
varEqual | 2群の分散が等しいと仮定するか。TRUEの場合は等しい、FALSEの場合は等しくない。 |
confInt | 信頼水準 |
実行例
簡単な実行例を紹介します。
データセットのファイルは以下のcsvファイル(エクセルは扱えません。エンコーディングがutf-8のcsvにしてください)を用います。
1列目と2列目に2群のデータが並ぶデータにしてください。
2群の分散が等しいと仮定し、信頼水準0.95の下で2標本t検定を実行する場合は、パラメータを以下の通りにセットします。
1 2 3 4 | fileName <- "2標本t検定データセット.csv" alternative <- "two.sided" #両側検定: "two.sided", 左片側検定: "less", 右片側検定: "greater") varEqual <- TRUE confLevel <- 0.95 |
パラメータを与えたら、あとはRを実行すれば2標本t検定の結果のcsvファイルを出力してくれます。
信頼区間やp値などを簡単に出力できます。
検定結果に出力される列は以下の通りです。
statistic | 検定統計量。 |
sample.mean of x | データセットの1列目の標本平均。xには列名が入ります。 |
sample.mean of y | データセットの2列目の標本平均。yには列名が入ります。 |
upper conf.int of mean difference | 2群の母平均の差の信頼区間の上限。 |
lower conf.int of mean difference | 2群の母平均の差の信頼区間の下限。 |
p.value | p値。 |