t检验

单样本t检验

DATA t1;

INPUT x@@;

CARDS;

20.99 20.41 20.10 20.00 20.91 22.60 20.99 20.41 20.00 23.00 22.00

;

PROC UNIVARIATE mu0=20.70 NORMAL;

VAR x;

RUN;

这段SAS代码的意义如下:

PROC UNIVARIATE:指定使用单变量分析过程。

mu0=20.70:指定假设总体均值为20.70。

NORMAL:指定数据符合正态分布。

VAR x:指定变量x为分析对象。

RUN:运行程序。综上,这段代码的意义是对变量x进行单变量分析,假设其均值为20.70,数据符合正态分布。

结果:首先进行统计描述,再正态性检验,最后求出置信区间与进行假设检验。

说明:

如果样本来自于正态分布的总体,那么样本数据也很可能符合正态分布。但是,由于样本容量较小或者存在离群值等情况,样本数据可能并不完全符合正态分布。因此,为了保证假设检验的准确性,需要对样本数据的正态性进行检验,例如使用Shapiro-Wilk检验、Kolmogorov-Smirnov检验等方法。如果样本数据不符合正态分布,可以考虑进行数据变换或者使用非参数检验方法。

Shapiro-Wilk检验是用于检验样本是否符合正态分布的一种方法,该检验是在原假设为样本来自于正态分布的情况下进行的,如果得出的p值小于预先设定的显著性水平(通常为0.05),则拒绝原假设,即认为样本不符合正态分布。原假设为“样本来自的总体与正态分布无显著性差异,即符合正态分布”。

配对t检验

DATA t2;

INPUT d@@;

CARDS;

3.48

7.41

7.48

9.42

8.25

3.35

6.95

7.41

6.35

7.41

8.58

;

PROC UNIVARIATE NORMAL;

VAR d;

RUN;

PROC MEANS MEAN STD T PRT CLM;

VAR d;

RUN;

这段SAS代码的意义如下:

第一部分:

PROC UNIVARIATE NORMAL:指定使用单变量分析过程,并假设数据符合正态分布。

VAR d:指定变量d为分析对象。

RUN:运行程序。综上,这段代码的意义是对变量d进行单变量分析,假设其符合正态分布。

n<2000, use Shapiro-wilk. n>2000, use Kolmogo-Smirnov.

第二部分:

PROC MEANS:指定使用均值过程。

MEAN STD T PRT CLM:指定输出均值、标准差、t值、p值和置信区间。

VAR d:指定变量d为分析对象。

RUN:运行程序。综上,这段代码的意义是计算变量d的均值、标准差、t值、p值和置信区间。

结果

两个独立样本t检验

data t3;

input group wt@@;

cards;

1 134

1 146

1 104

1 119

1 124

1 161

1 107

1 83

1 113

1 129

1 97

1 123

2 70

2 118

2 101

2 85

2 107

2 132

2 94

;

/*调用univariate进行正态性检验*/

proc univariate normal;

var wt;

class group;

run;

/*调用ttest过程进行两独立样本的T检验*/

proc ttest;

class group;

var wt;

run;

PROC TTEST:指定使用t检验过程。

CLASS group:指定变量group为分类变量。

VAR wt:指定变量wt为分析对象。

RUN:运行程序

参考阅读

评论可见,请评论后查看内容,谢谢!!!评论后请刷新页面。