Suponemos que una familia de leyes, que depende de un parámetro
desconocido , ha sido seleccionada. Ahora es de la muestra, y sólo
de ella, que se puede extraer la información. Se llama
estimador del parámetro
a toda función de la muestra,
que toma valores en el conjunto de los valores posibles de
. Evidentemente esta definición, un poco vaga, esconde la
idea que los valores que tome el estimador estarán cercanos
al valor
que se busca, el cual es, y continuará siendo,
desconocido.
Es importante distinguir entre los valores aleatorios, asociados a
la modelación, y sus realizaciones, identificadas a los datos. Una
muestra (teórica) es una -tupla de variables aleatorias
independientes
, que siguen una misma ley
. Para estimar
, se propone un estimador en
función de la muestra:
es también una variable aleatoria. La selección del modelo y
del estimador
está desconectada de la recolección de los
datos. Es, en cierta forma, una planificación que se hace antes de
realizar las observaciones y que podrá servir a varias muestras
que se recojan del mismo fenómeno.
Una vez que se selecciona el modelo, se considerará a una -tupla
de datos
como una realización de las variables
aleatorias
. El valor (real) que toma
:
Tomemos el ejemplo simple de una moneda de la cual ignoramos si
está adulterada o no. La probabilidad de caer sobre ''cara'' es el
parámetro desconocido . Nos proponemos realizar
lanzamientos de la moneda, lo que modelaremos por una muestra de
tamaño
de la
ley de Bernoulli de
parámetro
. El número de ''caras'' obtenido en los
lanzamientos es una variable aleatoria que sigue la
ley binomial
. El cociente entre esta variable aleatoria y
(la frecuencia) es un
estimador
de
. Realicemos ahora los
lanzamientos de la moneda
denotando cada vez por
si ha salido ''cara'', y 0 si no. Una
realización de la muestra es por ejemplo:
Para esta realización, la
frecuencia
empírica toma el valor ,
el cual propondremos como
estimación de
. Evidentemente,
nuevos lances de la misma moneda podrán conducir a una
realización diferente de la muestra y a otra estimación
de
.