序曲

秋风引

[唐] 刘禹锡

何处秋风至?萧萧送雁群。

朝来入庭树,孤客最先闻。

这首诗主要要表达的

中位数和平均数

,其实正是这羁旅之情和思归之心,但妙在不从正面着笔,始终只就秋风做文章,在篇末虽然推出了“孤客”,也只写到他“闻”秋风而止。至于他的旅情归思是以“最先”两字来暗示的。如李锳在《诗法易简录》中所说,“为孤客传神”的正在这两个字,使“无限情怀,溢于言表”。

多个独立简介

检验


样本

多样本问题主要涉及如何检验几种不同的方法、决策或处理所产生的结果是否一样。如不同运动方式或饮食习惯对减肥效果是否一样;不同药物处理方式的治疗效果是否一样;在商业活动中,不同的决策方案风险的大小是否有区别;不同促销方式的购买率是否相同等;在之前讲到的多组均数比较时,利用了方差分析来推断3个或3个以上总体均值的相等性;但方差分析要求正态分布、方差齐性,在实际数据中,满足这些条件的数据不多,所以使用时就受到限制,由此我们可以利用 非参数检验的多个独立样本检验。

其检验方法包括三种:

(1) Kruskal-Wallis H检验

(2) Jonckheere-Terpstra检验法

(3) 推广中的中位数检验法

SPSS实现多独立样本检验

示例1:用三种药物杀灭钉螺,每批用200只活钉螺,得到各组的死亡率(%),分析3种药物杀灭钉螺的效果有无差别?

1. 数据录入:

中位数和平均数-非参数检验 之 多独立样本检验插图

2. 建立假设:建立检验假设,确定检验水准 α

3. 参数选择

(1) 选择 分析—非参数检验—旧对话框—k个独立样本

中位数和平均数-非参数检验 之 多独立样本检验插图1

(2) 参数说明与选择

a. 检验列表:用于从列表中选择 检验,必须为数值型分类;若选择多个,将 死亡率 进行分析。

变量

b. 分组变量:指定分组变量,使用 定义组 进行定义分组变量取值

c. 检验方法类型:包括三种检验方法 克鲁斯卡尔-沃利斯、约克梅尔-塔伯斯特拉、中位数,具体应用场景在前面介绍,这里不再赘述

d. 统计:显示 数据基本描述,及 缺失值的处理方法

中位数和平均数-非参数检验 之 多独立样本检验插图2

e. 精确检验:

中位数和平均数-非参数检验 之 多独立样本检验插图3

4. 数据结果与说明

(1) 数据基本描述:显示总样本数、平均值、标准差、最小值、最大z值

中位数和平均数-非参数检验 之 多独立样本检验插图4

(2) 检验结果

中位数和平均数-非参数检验 之 多独立样本检验插图5

5. 语法:

***************** 多独立样本检验 *******************.
NPAR TESTS
  /K-W=死亡率 BY 药物(1 3)
  /STATISTICS DESCRIPTIVES
  /MISSING ANALYSIS.

通过上面示例我们可以得到不同组别之间存在显著性差异,但哪两个组别之间存在差异,从上面分析可看出无法得到。在新版的SPSS中提供了相应的分析方法。

示例2:具体数据同示例1,仍是分析各药物之间的差异。

1. 建立假设:建立检验假设,确定检验水准 α

2. 参数选择

(1) 选择 分析—非参数检验—独立样本

中位数和平均数-非参数检验 之 多独立样本检验插图6

(2) 参数说明

a. 目标:可快速指定常用的不同检验设置

o 在各个组之间自动比较分布:将对具有两个组的数据应用 Mann-Whitney U 检验,或对具有k个组的数据应用 Kruskal-Wallis 单因素 ANOVA 检验。

o 在各个组之间比较中位数:使用中位数检验来比较在不同组间观察到的中位数。

o 定制分析:若我们要自行设计各项检验设置,则可选择该项,在“设置”选项卡上的检验设置。注意:若随后在“设置”选项卡上更改了与当前选定目标不一致的选项,那么会自动选择该设置。

中位数和平均数-非参数检验 之 多独立样本检验插图7

b. 字段:设置检验字段与组别

o 检验字段:顾名思义,需要检验的字段;选择一个或多个连续字段或有序字段。

o 组:选择一个分类字段

中位数和平均数-非参数检验 之 多独立样本检验插图8

c. 设置

o 根据数据自动选择检验:该设置将对具有两个组的数据应用 Mann-Whitney U 检验,或对具有 k 个组的数据应用 Kruskal-Wallis 单因素 ANOVA 检验

o 定制检验:自行定义检验方法

(1) 各个组之间比较分布

从中我们可看到之前两独立样本检验、多独立样本检验中所提的的检验方法

中位数和平均数

,具体不一一介绍。重点看下与本章相关的克鲁斯卡尔-沃利斯AVONA检验(k个样本),可看到有个多重比较选择框,可以根据需要请求对 k 样本的多重比较,即所有成对多重比较或逐步降低比较。

(2) 各个组之间比较范围

(3) 各个组之间估算置信区间

(4) 各个组之间比较中位数

中位数和平均数-非参数检验 之 多独立样本检验插图9

3. 数据结果与说明

(1) 检验结果:

p 从下表可看到,零假设是在药物类别上,死亡率的分布相同;检验方式:独立样本K-W检验,从显著性p=0.008,并给出决策方案:拒绝零假设。

中位数和平均数-非参数检验 之 多独立样本检验插图10

(2) 检验结果-2:

中位数和平均数-非参数检验 之 多独立样本检验插图11

中位数和平均数-非参数检验 之 多独立样本检验插图12

4. 语法:

***************** 两独立样本检验 *******************.
*Nonparametric Tests: Independent Samples.
NPTESTS
  /INDEPENDENT TEST (死亡率) GROUP (药物) KRUSKAL_WALLIS(COMPARE=PAIRWISE)
  /MISSING SCOPE=ANALYSIS USERMISSING=EXCLUDE
  /CRITERIA ALPHA=0.05  CILEVEL=95.