Fonctions convexes

Définition 7   Soit $ f$ une fonction de $ \mathbb{R}$ dans $ \mathbb{R}$, définie sur un intervalle $ I$ contenant au moins deux points. On dit que $ f$ est convexe sur $ I$ si et seulement si :

$\displaystyle \forall x,y\in I ,\;\forall \lambda\in[0,1]\;,\quad f(\lambda x+(1-\lambda)y)\leqslant \lambda f(x)+(1-\lambda) f(y)\;.$ (2)

Si $ x<y$, et $ \lambda\in[0,1]$, alors $ \lambda
x+(1-\lambda)y$ est un point de l'intervalle $ [x,y]$. La condition (2) dit que le point de la courbe représentative d'abscisse $ \lambda
x+(1-\lambda)y$ doit être situé au-dessous du segment de sécante joignant les points $ (x,f(x))$ et $ (y,f(y))$ (figure 6). En d'autres termes, tout arc de la courbe représentative doit être situé au-dessous de sa corde. De manière équivalente, la partie du plan située au-dessus de la courbe représentative est une région convexe, au sens où tout segment joignant deux de ses points est entièrement contenu dans la région.
Figure 6: Courbe représentative d'une fonction convexe.
\includegraphics[width=8cm]{convexe}

Une fonction est dite concave si son opposée est convexe. Les propriétés sont inversées : tout arc est au-dessus de sa corde. La région du plan située au-dessous de la courbe représentative est convexe.

La fonction exponentielle est convexe, la fonction logarithme est concave. La fonction $ x\mapsto x^a$ est convexe sur $ \mathbb{R}^+$ pour $ a\geqslant
1$, elle est concave pour $ 0\leqslant a\leqslant 1$. La fonction $ x\mapsto 1/x$ est convexe sur $ \mathbb{R}^+$, concave sur $ \mathbb{R}^-$, de même que la fonction $ x\mapsto x^3$. Voici une autre caractérisation de la convexité.

Proposition 8   Soit $ f$ une fonction de $ \mathbb{R}$ dans $ \mathbb{R}$, définie sur un intervalle $ I$ contenant au moins deux points. La fonction $ f$ est convexe sur $ I$ si et seulement si, pour tout $ a\in I$ le taux d'accroissement $ \tau_a(x)$ est une fonction croissante de $ x$ sur $ I\setminus \{a\}$.

$\displaystyle \forall x,y\in I\setminus\{a\} ,\;x\leqslant y\;\Longrightarrow\;
\frac{f(x)-f(a)}{x-a}\leqslant
\frac{f(y)-f(a)}{y-a}\;.
$

Démonstration : Commmençons par la condition nécessaire. Soit $ a\in I$ et $ x,y\in
I\setminus\{a\}$ tels que $ x\leqslant y$. Trois cas sont possibles : $ x\leqslant y<a$, $ x<a<y$, $ a<x\leqslant y$. Nous traitons le premier, les deux autres sont analogues. Soit $ \lambda = (a-y)/(a-x)$. Alors $ y=\lambda x+ (1-\lambda)a$. Comme $ f$ est convexe,

$\displaystyle f(y)\leqslant \lambda f(x)+(1-\lambda)f(a)=
\frac{a-y}{a-x}f(x) +\left(1-\frac{a-y}{a-x}\right)f(a)\;.
$

On en déduit :

$\displaystyle \frac{f(y)-f(a)}{a-y}\leqslant \frac{f(x)-f(a)}{a-x}\;,
$

soit :

$\displaystyle \frac{f(x)-f(a)}{x-a}\leqslant \frac{f(y)-f(a)}{y-a}\;.
$

Montrons maintenant la condition suffisante. Soient $ x$ et $ y$ deux points de $ I$ tels que $ x<y$ et $ \lambda$ un réel dans $ [0,1]$. Posons $ a=\lambda x+(1-\lambda)y$, et donc :

$\displaystyle \lambda = \frac{y-a}{y-x}$   et$\displaystyle \quad
(1-\lambda) = \frac{a-x}{y-x}\;.
$

Si $ \lambda=0$ ou $ 1$, l'inégalité est vérifiée. Nous pouvons donc supposer que $ a$ est différent de $ x$ et $ y$. Écrivons que le taux d'accroissement en $ a$ est croissant.

$\displaystyle \frac{f(x)-f(a)}{x-a}\leqslant \frac{f(y)-f(a)}{y-a}\;.
$

En multipliant les deux membres par le produit $ (a-x)(y-a)$, qui est positif, on obtient :

$\displaystyle f(a)(y-x)\leqslant f(x)(y-a)+f(y)(a-x)\;.
$

En divisant par $ (y-x)$ ceci donne :

$\displaystyle f(a)\leqslant \frac{y-a}{y-x} f(x)+\frac{a-x}{y-x} f(y)
=\lambda f(x)+(1-\lambda)f(y)\;.
$

$ \square$

Corollaire 1   Si une fonction $ f$ est convexe sur un intervalle ouvert $ I$, alors elle est dérivable à gauche et à droite en tout point de $ I$, et donc continue sur $ I$.

Démonstration : Si $ a\in I$, le taux d'accroissement en $ a$, $ \tau_a(x)$, est une fonction croissante de $ x$. Il admet donc en $ a$ une limite à gauche et une limite à droite finies.$ \square$ Ce résultat n'est pas valable si l'intervalle n'est pas ouvert. Par exemple la fonction qui vaut 0 sur $ [0,1[ $, et $ 1$ au point $ 1$ est convexe sur $ [0,1]$, mais elle n'est pas continue en $ 1$. Le fait qu'une dérivée à gauche et à droite existe, n'implique pas que la fonction soit dérivable. Par exemple, la fonction valeur absolue $ x\mapsto \vert x\vert$ est convexe sur $ \mathbb{R}$ mais elle n'est pas dérivable en 0. Lorsque la fonction est dérivable, sa dérivée est croissante.

Proposition 9   Soit $ f$ une fonction de $ \mathbb{R}$ dans $ \mathbb{R}$, dérivable sur un intervalle ouvert $ I$. La fonction $ f$ est convexe sur $ I$ si et seulement si sa dérivée $ f'$ est croissante sur $ I$.

Démonstration : Commençons par la condition nécessaire. Soient $ x$ et $ y$ deux points de $ I$, tels que $ x<y$. Pour tout $ z\in [x,y]$,

$\displaystyle \frac{f(z)-f(x)}{z-x}\leqslant \frac{f(z)-f(y)}{z-y}\;.
$

En faisant tendre $ z$ vers $ x$, on en déduit :

$\displaystyle f'(x)\leqslant \frac{f(x)-f(y)}{x-y}\;.
$

De même, en faisant tendre $ z$ vers $ y$,

$\displaystyle \frac{f(x)-f(y)}{x-y}\leqslant f'(y)\;.
$

Donc $ f'(x)\leqslant f'(y)$.

Montrons maintenant la condition suffisante. Soient $ x,y$ deux points de $ I$ tels que $ x<y$, $ \lambda\in ]0,1[ $, et $ a=\lambda x+(1-\lambda)y$. Appliquons le théorème des accroissements finis sur les deux intervalles $ [x,a]$ et $ [a,y]$. Il existe $ c_1\in ]x,a[$ et $ c_2\in ]a,y[$ tels que :

$\displaystyle \frac{f(x)-f(a)}{x-a}=f'(c_1)$   et$\displaystyle \quad
\frac{f(y)-f(a)}{y-a}=f'(c_2)\;.
$

La fonction $ f'$ étant croissante, on a donc :

$\displaystyle \frac{f(x)-f(a)}{x-a}\leqslant \frac{f(y)-f(a)}{y-a}\;.
$

Comme nous l'avons déjà vu dans la démonstration de la proposition 8, ceci entraîne

$\displaystyle f(a)\leqslant \lambda f(x)+(1-\lambda)f(y)\;.
$

$ \square$ Graphiquement, la pente de la tangente d'une fonction convexe est croissante. Dans la démonstration précédente, nous avons établi les inégalités :

$\displaystyle f'(x)\leqslant \frac{f(x)-f(y)}{x-y}\leqslant f'(y)\;.
$

On en déduit que pour $ x<y$,

$\displaystyle f(y)\geqslant f(x)+f'(x)(y-x)$   et$\displaystyle \quad
f(x)\geqslant f(y)+f'(y)(x-y)\;.
$

Donc la courbe représentative de $ f$ reste au-dessus de ses tangentes (figure 6).

Corollaire 2   Soit $ f$ une fonction de $ \mathbb{R}$ dans $ \mathbb{R}$, deux fois dérivable sur un intervalle ouvert $ I$. La fonction $ f$ est convexe sur $ I$ si et seulement si sa dérivée seconde $ f''$ est positive ou nulle sur $ I$.

Une fonction deux fois dérivable est concave si et seulement si sa dérivée seconde est négative ou nulle. Les points où la dérivée seconde s'annule et change de signe correspondent graphiquement à des points où la courbe représentative passe de concave à convexe où inversement. On les appelle des points d'inflexion.

         © UJF Grenoble, 2011                              Mentions légales