Polynômes de Bernstein

Il ne faut pas espérer qu'une série entière converge uniformément sur tout $ \mathbb{R}$, voici pourquoi.

Proposition 5   La limite uniforme sur un intervalle non borné de $ \mathbb{R}$, d'une suite de polynômes est un polynôme.

Démonstration : Soit $ (P_n)$ une suite de polynômes. Si elle converge uniformément sur $ I$, elle est uniformément de Cauchy. Il existe $ n_0$ tel que pour tout $ n>n_0$, et pour tout $ x\in I$,

$\displaystyle \vert P_n(x)-P_{n_0}(x)\vert<1\;.
$

Le polynôme $ P_n-P_{n_0}$ doit donc être borné sur $ I$ qui est non borné : ce n'est possible que s'il est constant. Donc :

$\displaystyle \forall x\in I\;,\quad P_n(x)=P_{n_0}(x)+P_n(0)-P_{n_0}(0)\;.
$

Soit $ f$ la limite de la suite $ (P_n)$.

$\displaystyle \forall x\in I\;,\quad f(x)=P_{n_0}(x)+f(0)-P_{n_0}(0)\;.
$

$ \square$ Sur un intervalle fermé borné, la situation change radicalement.

Théorème 22 (de Weierstrass)   Toute fonction continue sur un intervalle fermé borné est limite uniforme d'une suite de polynômes.

Ce magnifique résultat a fait l'objet de toutes sortes de démonstrations, et de généralisations (sous le nom de «Théorème de Stone-Weierstrass»). C'est un théorème d'existence, qui ne dit rien a priori sur la manière de construire la suite de polynômes qu'il affirme exister. Il se trouve qu'il est possible de construire une telle suite... en jouant tout simplement à pile ou face. Soit $ f$ une fonction continue de $ [0,1]$ dans $ \mathbb{R}$. Soit $ x\in[0,1]$, et supposez que vous disposiez d'une pièce qui retourne «Pile» avec probabilité $ x$. Si vous lancez la pièce $ n$ fois, le nombre de fois où vous obtenez «Pile» suit la loi binomiale de paramètres $ n$ et $ x$ : il vaut $ k\in\{0,\ldots,n\}$ avec probabilité :

$\displaystyle \binom{n}{k}x^k(1-x)^{n-k}\;.
$

La loi des grands nombres (et votre bon sens) dit que si $ n$ est grand, le nombre de fois où vous tombez sur pile divisé par $ n$ (la fréquence), est proche de $ x$. En termes probabilistes, la loi de probabilité de la variable aléatoire «fréquence de Pile» converge vers la masse de Dirac en $ x$. Donc pour toute fonction $ f$ continue sur $ [0,1]$,

$\displaystyle \forall x\in[0,1]\;,\quad f(x)=\lim_{n\to+\infty} \sum_{k=0}^n
f\left(\frac{k}{n}\right) \binom{n}{k}x^k(1-x)^{n-k} \;.
$

Et voilà le travail ! Euh pas tout à fait quand même. La loi des grands nombres n'affirme qu'une limite simple et il reste à démontrer qu'elle est uniforme. Démonstration : Comme entrée en matière, vérifier que la somme des probabilités de la loi binomiale vaut $ 1$ relève de la formule du binôme (d'où le nom).

$\displaystyle \sum_{k=0}^n \binom{n}{k}x^k(1-x)^{n-k}= (x+(1-x))^n=1 \;.
$

Vous savez peut être aussi que l'espérance de la loi $ \mathcal{B}(n,x)$ est $ nx$ et que sa variance est $ nx(1-x)$ :

$\displaystyle \sum_{k=0}^n k\binom{n}{k}x^k(1-x)^{n-k}=nx$   et$\displaystyle \quad
\sum_{k=0}^n (k-nx)^2\binom{n}{k}x^k(1-x)^{n-k}=nx(1-x)\;.
$

(Oubliez les probabilités, et redémontrez directement ces formules, c'est un bon exercice). Soit $ f$ une fonction continue sur $ [0,1]$. Elle est bornée : il existe $ M$ tel que

$\displaystyle \forall x\in[0,1]\;,\quad \vert f(x)\vert<M\;.
$

De plus, d'après le théorème de Heine, elle est uniformément continue. Pour tout $ \varepsilon $, il existe $ \eta$ tel que

$\displaystyle \forall x,y\in[0,1]\;,\quad \vert x-y\vert<\eta\;\Longrightarrow \vert f(x)-f(y)\vert<\frac{\varepsilon }{2}\;.
$

La différence entre $ f$ et son approximation d'ordre $ n$, s'exprime comme suit :
$\displaystyle \displaystyle{
\left\vert f(x)-\sum_{k=0}^n f\left(\frac{k}{n}\right)  \binom{n}{k}x^k(1-x)^{n-k} \right\vert}$ $\displaystyle =$ $\displaystyle \displaystyle{
\left\vert \sum_{k=0}^n\left(f(x)-f\left(\frac{k}{n}\right)\right)  \binom{n}{k}x^k(1-x)^{n-k} \right\vert}$  
  $\displaystyle \leqslant$ $\displaystyle \displaystyle{
\sum_{k=0}^n\left\vert f(x)-f\left(\frac{k}{n}\right)\right\vert   \binom{n}{k}x^k(1-x)^{n-k}\;.}$  

Notons cette somme $ \Delta_n$. Nous la séparons en deux, en isolant les valeurs de $ k$ telles que $ \frac{k}{n}$ est proche de $ x$ :

$\displaystyle K_n=\left\{ k ,\;\left\vert\frac{k}{n}-x\right\vert<\eta  \right\}$   et$\displaystyle \quad
\overline{K_n}=\{0,\ldots,n\}\setminus K_n\;.
$


$\displaystyle \Delta_n$ $\displaystyle =$ $\displaystyle \displaystyle{
\sum_{k\in K_n}\left\vert f(x)-f\left(\frac{k}{n}\...
...t\vert f(x)-f\left(\frac{k}{n}\right)\right\vert
\!\binom{n}{k}x^k(1-x)^{n-k}
}$  
  $\displaystyle \leqslant$ $\displaystyle \displaystyle{
\frac{\varepsilon }{2}
\sum_{k\in K_n}
\binom{n}{k}x^k(1-x)^{n-k}
+
2M\sum_{k\in \overline{K_n}}
\binom{n}{k}x^k(1-x)^{n-k}
}$  
  $\displaystyle \leqslant$ $\displaystyle \displaystyle{
\frac{\varepsilon }{2}
\sum_{k\in K_n}
\binom{n}{k...
..._{k\in \overline{K_n}}
\left(\frac{k}{n}-x\right)^2\binom{n}{k}x^k(1-x)^{n-k}
}$  
  $\displaystyle \leqslant$ $\displaystyle \displaystyle{
\frac{\varepsilon }{2}
\sum_{k=0}^n
\binom{n}{k}x^...
...frac{2M}{n^2\eta^2}\sum_{k=0}^n
\left(k-nx\right)^2\binom{n}{k}x^k(1-x)^{n-k}
}$  
  $\displaystyle =$ $\displaystyle \displaystyle{
\frac{\varepsilon }{2}
+
\frac{2M}{n^2\eta^2}nx(1-x)
}$  
  $\displaystyle \leqslant$ $\displaystyle \displaystyle{
\frac{\varepsilon }{2}
+
\frac{2M}{4n\eta^2}
\;.}$  

Il ne reste plus qu'à choisir $ n_0$ tel que pour tout $ n>n_0$, $ \displaystyle{\frac{2M}{4n\eta^2}<\frac{\varepsilon }{2}}$.$ \square$ Passer de l'intervalle $ [0,1]$ à n'importe quel intervalle fermé borné demande un simple changement de variable affine : $ x\longmapsto a+(b-a)x$. N'en déduisez pas pour autant que les polynômes de Bernstein soient une bonne méthode pour calculer des approximations de fonctions. L'erreur en norme uniforme sur $ [0,1]$ est de l'ordre de $ \frac{1}{\sqrt{n}}$, ce qui est bien plus mauvais que ce que l'on obtient avec les polynômes de Lagrange, Hermite, Legendre, ou autres. Bonne nouvelle, nous changeons de siècle : ce qui précède est paru dans une petite note de deux pages (en français) aux Communications de la Société Mathématique de Kharkov, volume 13, année 1912/13, sous le titre «Démonstration du théorème de Weierstrass fondée sur le calcul des probabilités». Pourquoi Sergueï Natanovitch Bernstein (1880-1968), natif d'Odessa, écrivait-il en français à Kharkov ? D'une part parce qu'il avait fait sa thèse à Paris (Hilbert et Picard au jury tout de même...), d'autre part parce que c'était encore un temps où une grande partie des scientifiques comprenaient le français. Revenu en Russie, et malgré son parcours parisien brillant, il avait dû passer un second doctorat à Kharkov pour pouvoir y enseigner, son diplôme étranger n'étant pas reconnu.


         © UJF Grenoble, 2011                              Mentions légales