Test sobre el valor de un cuantil

Sección : Tests no paramétricos
Previo : Tests no paramétricos
Siguiente : Test de Kolmogorov-Smirnov

Test sobre el valor de un cuantil

Aquí, como en todo el capítulo, el modelo básico es el de una muestra de una ley desconocida . Por lo tanto suponemos que los datos son realizaciones de variables aleatorias independientes de una misma ley . No se supone que esta ley pertenece a una familia paramétrica particular (de aquí el nombre de test no paramétrico). En un primer momento, la hipótesis ${\cal H}_0$ se referirá al valor de un cuantil de .

Tomemos el caso de un tratamiento que se supone hace bajar los niveles de colesterol. Para cada individuo de un grupo de pacientes, se mide la diferencia entre los niveles de colesterol después y antes del tratamiento. Algunas de estas diferencias son negativas (disminución del nivel de colesterol) otras positivas (aumento). La hipótesis ${\cal H}_0$ es que el tratamiento no tiene un efecto significativo. Rechazaremos ${\cal H}_0$ (decidiremos que el tratamiento es eficaz) si se observa una cantidad suficiente de disminuciones. El estadígrafo de test es el número de descensos:

$\displaystyle T= \sum_{i=1}^n \mathbb {I}_{(-\infty,0]}(X_i)\;,$

La notación $\mathbb {I}_A(x)$ designa a la función indicatriz del conjunto , que vale si $x\in A$ y 0 si no. Si ${\cal H}_0$ es verdadera, la mediana de la ley de las es nula y sigue la ley binomial ${\cal B}(n,0.5)$ .

Generalizamos esta situación para el valor de un cuantil cualquiera.

Proposición 2.1 Sea $(X_1,\ldots,X_n)$ una muestra de la ley

, de función cuantil

. Sea $u\in ]0,1[$ un número real fijo. Consideremos la hipótesis nula:

$\displaystyle {\cal H}_0\;:\; Q(u)=q_0\;,$

donde

es un número real fijo. Sea

el número de elementos de la muestra, inferiores a

$\displaystyle T= \sum_{i=1}^n \mathbb {I}_{(-\infty,q_0]}(X_i)\;.$

Entonces bajo la hipótesis ${\cal H}_0$ ,

sigue la ley binomial ${\cal B}(n,u)$ .

El caso particular en el que y , presentado en el ejemplo, lleva el nombre especial de test de signos. Supongamos que en un grupo de individuos se observaron descensos en el nivel de colesterol. El p-valor correspondiente es :

$\displaystyle p(29) = 1-F_{{\cal B}(46,0.5)}(28) = 0.0519\;.$

Para una muestra grande, se puede remplazar la ley binomial por su aproximación normal. Bajo ${\cal H}_0$ , el estadígrafo:

$\displaystyle T' = \frac{T-nu}{\sqrt{nu(1\!-\!u)}}\;,$

que está centrado y reducido, sigue la ley normal ${\cal N}(0,1)$ . En el ejemplo que hemos visto,

toma el valor

. El p-valor correspondiente es:

$\displaystyle 1-F_{{\cal N}(0,1)}(1.7693) = 0.0384\;.$

Es aconsejable limitar el uso de la aproximación por la normal únicamente a los casos en los que la ley no se pueda calcular exactamente.

Sección : Tests no paramétricos
Previo : Tests no paramétricos
Siguiente : Test de Kolmogorov-Smirnov