举个年龄的例子,年龄可分为:①20岁以下,②20~40岁,③40~60岁,④60岁以上等年龄组, 重新编码的命令如下:
PROC FORMAT;
VALUE ageF LOW-20=’1’ 20-40=’2’ 40-60=’3’ 60-High=’4’;
FORMAT age ageF.;
∵皮尔逊卡方(Chi-Square)为9.2684,自由度(DF)为4,其概率值(Prob)为0.0547。
又∵0.0547≥α理论值0.05。
∴没有理由拒绝原假设,从总体说sex(性别)与edc(文化程度)互为独立。
如果数据来自服从正态分布的总体,可用下面的经验规则很快地概括出我们的数据。
经验规则有:
·68%的观察值是落在离均值一个标准偏差(1σ)的范围内。
·95%的观察值是落在离均值两个标准偏差(2σ)的范围内。
·99%的观察值是落在离均值三个标准偏差(3σ)的范围内。
S.AS的数据集是SAS源程序运行之后所生成的目标数据,即SAS系统内部能识别的数据集,它相当于SPSS的*.sav数据。可用SET命令复制SAS数据集。比如:
D.ATAone;
I.NPUTabc;
C.ards;
数据行
D.ATAtwo;/*预先为one的复制品起名为two*/
S.etone;/*‘数据集two’是从‘数据集one’中复制的。*/
指导语主要用来告诉填答者如何填好问卷中的答案,比如:
(1)问卷中画横线“_____”处,请您填入符合自己情况的数字和答案。
(2)问卷中的多项选择题,请在符合您自己情况的该项前面的序号上,画一个“○”;如:性别:①-男2-女
(3)如果某些问题比较复杂,则应该逐一在题后用括号加以说明。比如:“(此题有5个答案,请选择最重要的1个)”,“(此题填法与上面相同)”,“(居住面积不包括阳台)”等。
总之,问卷中模糊不清的地方一定要加以详细说明。
PROC CORR Spearman;
VAR Height Weight;(此句Weight指体重变量)
独立组样本T检验要求数据符合以下3个条件:
(1)观察值之间是独立的。
(2)每组观察值是来自正态分布的总体(此点决定了数据必须来自定距以上的变量)。
(3)两个独立组的方差相等。
H.0:两个子总体的方差相等。
H.0’:μ1=μ2(两个子总体的均值相等)
计算出的Hoeffding 的D统计量应乘以30倍。其D值范围为:-0.5 <D <1。当D值为较大的正值时,才表明变量间存在相关。