Aquí, como en todo el capítulo, el modelo básico es el de una muestra de una ley desconocida . Por lo tanto suponemos que los datos son realizaciones de variables aleatorias independientes de una misma ley . No se supone que esta ley pertenece a una familia paramétrica particular (de aquí el nombre de test no paramétrico). En un primer momento, la hipótesis se referirá al valor de un cuantil de .
Tomemos el caso de un tratamiento que se supone hace bajar los niveles de colesterol. Para cada individuo de un grupo de pacientes, se mide la diferencia entre los niveles de colesterol después y antes del tratamiento. Algunas de estas diferencias son negativas (disminución del nivel de colesterol) otras positivas (aumento). La hipótesis es que el tratamiento no tiene un efecto significativo. Rechazaremos (decidiremos que el tratamiento es eficaz) si se observa una cantidad suficiente de disminuciones. El estadígrafo de test es el número de descensos:
La notación designa a la función indicatriz del conjunto , que vale si y 0 si no. Si es verdadera, la mediana de la ley de las es nula y sigue la ley binomial .
Generalizamos esta situación para el valor de un cuantil cualquiera.
El caso particular en el que y , presentado en el ejemplo, lleva el nombre especial de test de signos. Supongamos que en un grupo de individuos se observaron descensos en el nivel de colesterol. El p-valor correspondiente es :
Para una muestra grande, se puede remplazar la ley binomial por su aproximación normal. Bajo , el estadígrafo:
Es aconsejable limitar el uso de la
aproximación por la normal únicamente a los casos en los que la
ley no se pueda calcular exactamente.