Nos situamos en el caso más frecuente, donde las variables son modeladas por una muestra de una cierta ley desconocida. Hasta ahora, hemos considerado hipótesis que tienen que ver con una sola ley , lo que permitía determinar la ley de un estadígrafo de test en función de la muestra, y por tanto calcular las probabilidades de error (umbral o riesgo). Cuando una hipótesis tiene que ver con una sola ley se dice que es simple. En el caso contrario, decimos que es compuesta.
Frecuentemente, el modelo presupone que la ley desconocida
pertenece a una cierta familia de leyes prefijada, que dependen de
uno o más parámetros (leyes binomiales, leyes normales...).
Denotaremos por al parámetro y por a la ley
desconocida. Un test sobre los valores de se llama
paramétrico. Una hipótesis simple será del tipo
, donde es un valor prefijado. Las
hipótesis compuestas serán del tipo
,
o
.
Para hacer un test sobre el valor del parámetro, lo más lógico consiste en emplear como estadígrafo de test a un estimador convergente de este parámetro. Un estimador convergente es un estadígrafo (función de la muestra), que toma valores que estarán más cercanos a mientras más grande sea el tamaño de la muestra. Si es un estimador convergente de , entonces bajo la hipótesis , debe tomar valores cercanos a . Se rechazará cuando toma valores muy alejados de .
Veamos el caso de dos hipótesis simples :
Si , el test será unilateral a la derecha (rechazo de los valores de muy grandes). Pero la definición del test no tiene en cuenta a : será la misma para cualquier valor , y también para:
igual en el caso:
Se empleará un test bilateral para probar :
Una manera frecuentemente empleada para definir un test paramétrico a partir de una estimación de es de utilizar un intervalo de confianza.
Por tanto un intervalo de confianza contiene al valor del parámetro con una fuerte probabilidad. Si la hipótesis es verdadera, el intervalo de confianza debe contener a .
Consideremos el caso de una muestra de la ley exponencial . Queremos un test bilateral de la hipótesis . El estimador natural de es el inverso de la media empírica . Para una muestra de la ley , la media empírica sigue la ley gamma , por tanto la variable aleatoria sigue la ley gamma . Se deduce que el siguiente intervalo es un intervalo de confianza de nivel para :
La regla de decisión para el test de umbral que se
deduce de este intervalo de confianza será:
Rechazo de | |||
En este caso, el test basado en el intervalo de confianza es
equivalente al test basado en el
intervalo de dispersión
simétrico de la ley de bajo
(pero no siempre
es así).