Main Content

ranksum

威尔科克森秩和检验

说明

示例

p = ranksum(x,y) 返回双侧威尔科克森秩和检验的 p 值。ranksum 检验 xy 中的数据是来中位数相等的连续分布的样本这一原假设,其备择假设为这些数据来自中位数不相等的连续分布的样本。检验假设两个样本是独立的。xy 可以有不同长度。

此检验等效于曼-惠特尼 U 检验。

示例

[p,h] = ranksum(x,y) 也返回一个逻辑值,表示检验决策。结果 h = 1 表示拒绝原假设,h = 0 表示未能在 5% 显著性水平上拒绝原假设。

示例

[p,h,stats] = ranksum(x,y) 也返回结构体 stats 以及关于检验统计量的信息。

示例

[___] = ranksum(x,y,Name,Value) 返回上述语法中的任何输出参量,用于秩和检验,附加选项由一个或多个 Name,Value 对组参量指定。

示例

全部折叠

检验两个独立的大小不等的样本的中位数相等的假设。

生成样本数据。

rng('default') % for reproducibility
x = unifrnd(0,1,10,1);
y = unifrnd(0.25,1.25,15,1);

这些样本来自除了位置偏移 0.25 之外具有相同分布的总体。

检验 xy 的中位数是否相等。

p = ranksum(x,y)
p = 0.0375

p 值 0.0375 表示 ranksum 在默认 5% 显著性水平上拒绝相等中位数的原假设。

获得两个总体中位数相等的检验的统计量。

加载样本数据。

load mileage

检验第一种和第二种类型的汽车的每加仑行驶里程是否相同。

[p,h,stats] = ranksum(mileage(:,1),mileage(:,2))
p = 0.0043
h = logical
   1

stats = struct with fields:
    ranksum: 21.5000

p 值 0.043 和 h = 1 都表明在默认 5% 显著性水平上拒绝相等中位数的原假设。由于样本大小很小(每个样本数为六),因此 ranksum 使用精确方法计算 p 值。结构体 stats 只包括秩和检验统计量的值。

检验总体中位数增大的假设。

加载样本数据。

load('weather.mat');

气象数据显示连续两年中同一个月内的每日最高气温。

执行左侧检验,以评估在 1% 显著性水平上中位数增大。

[p,h,stats] = ranksum(year1,year2,'alpha',0.01,...
'tail','left')
p = 0.1271
h = logical
   0

stats = struct with fields:
       zval: -1.1403
    ranksum: 837.5000

基于 p 值 0.1271 和逻辑值 h = 0,没有足够的证据拒绝原假设。也就是说,在 1% 的显著性水平上,结果没有显示从第 1 年到第 2 年月的中位数高温存在正偏移。请注意,由于样本大小较大,因此 ranksum 使用逼近方法来计算 p 值。

使用精确方法计算 p 值。

[p,h,stats] = ranksum(year1,year2,'alpha',0.01,...
'tail','left','method','exact')
p = 0.1273
h = logical
   0

stats = struct with fields:
    ranksum: 837.5000

逼近方法和精确方法的结果是一致的。

输入参数

全部折叠

样本数据,指定为向量。

数据类型: single | double

样本数据,指定为向量。y 的长度不必与 x 的长度相同。

数据类型: single | double

名称-值参数

将可选的参量对组指定为 Name1=Value1,...,NameN=ValueN,其中 Name 是参量名称,Value 是对应的值。名称-值参量必须出现在其他参量后,但参量对组的顺序无关紧要。

在 R2021a 之前,使用逗号分隔每个名称和值,并用引号将 Name 引起来。

示例: 'alpha',0.01,'method','approximate','tail','right' 指定具有 1% 显著性水平的右尾秩和检验,它返回逼近的 p 值。

假设检验决策的显著性水平,指定为以逗号分隔的对组,其中包含 'alpha' 和 0 到 1 范围内的一个标量值。h 的显著性水平是 100 * alpha%。

示例: 'alpha', 0.01

数据类型: double | single

p 值 p 的计算方法,指定为由 'method' 和以下项之一组成的以逗号分隔的对组:

'exact'p 值 p 的精确计算。
'approximate'计算 p 值 p 时的正态逼近。

当未指定 'method' 时,默认值为:

  • 'exact'(如果 min(nx,ny) < 10 且 nx + ny < 20)

  • 'approximate'(其他情况下)

nx 和 ny 分别是 xy 中样本的大小。

示例: 'method','exact'

检验的类型,指定为以逗号分隔的对组,其中包含 'tail' 和以下项之一:

'both'双侧假设检验,其中备择假设表明 xy 具有不同中位数。未指定 'tail' 时的默认检验类型。
'right'右尾假设检验,其中备择假设表明 x 的中位数大于 y 的中位数。
'left'左尾假设检验,其中备择假设表明 x 的中位数小于 y 的中位数。

示例: 'tail','left'

输出参数

全部折叠

检验的 p 值,以 0 到 1 范围内的正标量形式返回。p 是观测到的检验统计量与原假设下观测到的值一样极端或更极端的概率。ranksum 通过将最显著的单侧值加倍来计算双侧 p 值。

假设检验的结果,以逻辑值形式返回。

  • 如果 h = 1,这表示在 100 * alpha% 显著性水平上拒绝原假设。

  • 如果 h = 0,这表示未能在 100 * alpha% 显著性水平上拒绝原假设。

检验统计量,以结构体形式返回。存储在 stats 中的检验统计量是:

  • ranksum :秩和检验统计量的值

  • zval:z 统计量的值(当 'method''approximate' 时计算)

详细信息

全部折叠

威尔科克森秩和检验

当样本独立时,威尔科克森秩和检验是两个总体的非参数化检验。如果 XY 是样本大小不同的独立样本,则 ranksum 返回的检验统计量是第一个样本的秩和。

威尔科克森秩和检验等效于曼-惠特尼 U 检验。曼-惠特尼 U 检验是一种非参数化检验,用于检验两个独立样本 XY 的总体中位数的相等性。

曼-惠特尼 U 检验的统计量 U 是在两个独立样本 XY 中元素的有序排列中,y 先于 x 的次数。它与威尔科克森秩和统计量的关系如下:如果 X 是大小为 nX 的样本,则

U=WnX(nX+1)2.

z 统计量

对于大样本,ranksum 使用 z 统计量来计算检验的逼近 p 值。

如果 XY 是大小为 nX 和 nY 的两个独立样本,其中 nX < nY,则 z 统计量为

z=WE(W)V(W)=W[nXnY+nX(nX+1)2]0.5sign(WE(W))nXnY(nX+nY+1tiescor)12,

其中进行连续性校正和结值调整。此处 tiescor 由下式给出

tiescor=2tieadj(nX+nY)(nX+nY1),

其中 ranksum 使用 [ranks,tieadj] = tiedrank(x,y) 来获得结值调整。标准正态分布给出了此 z 统计量的 p 值。

算法

ranksumxy 中的 NaN 视为缺失值并忽略它们。

对于样本大小不相等的中位数双侧检验,ranksum 返回的检验统计量是第一个样本的秩和。

参考

[1] Gibbons, J. D., and S. Chakraborti. Nonparametric Statistical Inference, 5th Ed., Boca Raton, FL: Chapman & Hall/CRC Press, Taylor & Francis Group, 2011.

[2] Hollander, M., and D. A. Wolfe. Nonparametric Statistical Methods. Hoboken, NJ: John Wiley & Sons, Inc., 1999.

版本历史记录

在 R2006a 之前推出