Dada una muestra observada
y una ley de probabilidad
, la verosimilitud cuantifica
la probabilidad de que las observaciones provengan efectivamente, de
una muestra (teórica) de la ley
.
Tomemos el ejemplo de lanzar 10 veces una moneda. La muestra binaria observada es, por ejemplo:
Para una muestra de tamaño 10 de la
ley de Bernoulli de parámetro
, la probabilidad de una tal realización es de
.
Veamos algunos valores numéricos.
Es natural seleccionar como valor estimado de , aquel para el
cual la probabilidad de la muestra observada es más fuerte, en
este caso
. La figura 3 compara las
funciones que a
asocian
para diferentes
valores de
. Todas tienen su máximo en
. El máximo es
más marcado según
es más grande.
La interpretación es la siguiente. Consideremos una muestra
teórica
de la ley
. Por definición,
las variables aleatorias
son independientes y de
una misma ley
. Por lo tanto la probabilidad que la muestra
teórica
tenga por realización la muestra
observada
, es el producto de las probabilidades
de que cada
tome el valor
, es decir:
En el caso de un modelo continuo, la ley tiene una
densidad sobre
, y la probabilidad que la muestra tome un
valor particular es siempre nula. Hay que reemplazar la
probabilidad
por su densidad en la definición de
verosimilitud.
La interpretación es la siguiente. Consideremos una muestra
teórica
de la ley continua
. Sea
un número real estrictamente positivo (pequeño). La
probabilidad de que la muestra teórica
tenga una
realización en una ``
vecindad'' de la muestra
observada
puede escribirse como:
![]() ![]() ![]() |
![]() |
![]() |
|
![]() |
![]() |
||
![]() |
![]() |
Estimar un parámetro por el método de
máxima
verosimilitud, es proponer como valor
del parámetro aquél que da un valor máximo a la verosimilitud,
es decir, a la probabilidad de observar los datos como realización
de una muestra de la ley .
Retomemos el ejemplo de la
ley uniforme sobre el intervalo
. Su densidad es:
La verosimilitud es la función que a números reales
y a un valor positivo
asigna:
![]() |
![]() |
![]() |
|
![]() |
![]() |
||
![]() |
![]() |
Considerada como función de , la verosimilitud es nula si
es menor que el mayor de los valores observados, si no,
vale
. Por lo tanto ella es máxima para:
Si
es una muestra de la ley uniforme
, el estimador de máxima verosimilitud de
es:
Para la mayoría de las leyes de probabilidad usuales, el estimador de máxima verosimilitud se define de forma única y se calcula explícitamente. En el plano teórico tiene muchas ventajas. Bajo hipótesis que cumplen numerosos modelos de uso corriente, se demuestra que es asintóticamente insesgado y consistente. Se demuestra, además, que su varianza es minimal, por lo tanto el método de máxima verosimilitud es teóricamente el mejor de los métodos de estimación. Cuando una determinación explícita es imposible, hay que recurrir a una determinación numérica, empleando un algoritmo de optimización.