Le but de cette section est d'étudier les variations d'une fonction
de
dans
, et en particulier de déterminer les
points de l'espace où elle atteint son maximum et son minimum. Afin
de mieux visualiser les notions introduites, nous nous plaçons en
dimension . La fonction
se représente par
la surface d'équation dans l'espace. Nous commençons
par la notion de dérivée directionnelle.
Pour comprendre cette définition, considérons la fonction de
dans
, qui à associe :
Elle définit une courbe sur la surface d'équation ,
au-dessus de la droite
(voir figure
6). On dérive cette fonction par rapport à
comme une fonction composée :
Soit en :
La dérivée directionnelle décrit les variations de
autour de ,
dans la direction du vecteur .
Figure 6:
Dérivée directionnelle.
|
La direction selon laquelle la croissance de la surface est la plus
forte est celle du gradient de la fonction. À titre d'exemple, nous
avons représenté sur la figure 7 quelques
valeurs du gradient de la fonction . Pour comparaison, nous
avons mis à côté une représentation de la fonction par niveaux
de gris : au lieu de la surface
(figure 4),
les valeurs de la fonction sont symbolisées par des niveaux de gris,
d'autant plus clairs que les valeurs sont plus fortes. Les points blancs
sont des maxima de la fonction, et les points noirs des minima. On
constate que le gradient, s'il est non nul,
est toujours orienté vers le haut, dans la
direction de la «ligne de plus grande pente».
Figure:
Représentation par niveaux de gris de
et champ
de gradient correspondant.
|
Sur la figure 7, on observe que le gradient est nul
pour les maxima et les minima. Définissons d'abord la notion de
maximum et minimum local.
Définition 9
Soit un domaine ouvert de
, une fonction
définie sur , et un point de .
On dit que admet un maximum (respectivement un minimum)
local en , s'il existe
tel que
(respectivement
),
pour tout tel que
et
.
Démonstration : Si admet un extremum (maximum ou minimum) local en alors
il en est de même si on restreint à la direction
autour de . La dérivée de la fonction (de )
doit donc être nulle en . Donc :
Mais les dérivées directionnelles ne peuvent être nulles dans
toutes les directions que si le gradient lui même est nul. Les points du plan où le gradient de s'annule sont les
points critiques de .
La nullité du gradient n'est qu'une
condition nécessaire pour qu'un point soit un extremum. Rappelons
tout d'abord quelle est la situation pour les fonctions d'une
variable, deux fois continûment dérivable.
Si la fonction
admet un maximum ou un minimum
local en alors . Réciproquement :
- Si et si
, alors 0 est un maximum local pour .
- Si et si
, alors 0 est un minimum local pour .
Revenons alors à une fonction de variables, que nous supposons
deux fois continûment différentiable. Examinons cette
fonction dans la direction autour de .
Le point sera un maximum de si 0 est un maximum pour
, quelle que soit la direction .
Calculons la dérivée seconde de :
Donc en :
Cette expression peut s'écrire sous la forme matricielle suivante,
qui fait intervenir la matrice hessienne de .
Il se trouve que, comme pour toute matrice
symétrique réelle,
il existe une matrice orthogonale
(vérifiant
) et deux réels et tels que :
Les réels et sont les valeurs propres de la
matrice hessienne. Pour les calculer, il suffit de connaître
leur somme, qui est la trace de la matrice hessienne, et leur produit,
qui est son déterminant.
et
On résoud alors l'équation du second degré dont et
sont solution.
Posons :
La dérivée seconde de en 0 s'écrit :
Le signe de dépend donc des signes de et .
- Si et , alors quelle que soit la
direction , donc le point est un maximum local pour .
- Si et , alors quelle que soit la
direction , donc le point est un minimum local pour .
- Si et , alors dans la direction
, et dans la direction . Dans ce cas
on dit que le point est un point selle pour .
Les trois cas sont illustrés sur la figure 8.
Figure 8:
Maximum, minimum et point selle pour une fonction de
dans
.
|
Voici un exemple.
Le gradient et la matrice hessienne au point sont :
Le gradient s'annule en 4 points dans le plan. Nous les donnons avec
les valeurs propres de la matrice hessienne et la nature du point.
L'étude précédente se généralise aux fonctions de
dans
.
Théorème 6
Soit un domaine ouvert de
, une fonction deux fois
continûment différentiable sur et un point de .
Notons le gradient et la matrice hessienne de
au point .
- Si et si
a toutes ses valeurs propres strictement négatives,
alors est un maximum local pour .
- Si et si
a toutes ses valeurs propres strictement positives,
alors est un minimum local pour .
Les valeurs propres de sont les racines du polynôme , où
est le déterminant de la matrice , étant la matrice
indentité de taille .
© UJF Grenoble, 2011
Mentions légales