Polynômes d'endomorphismes

Dans cette section, nous allons raisonner en termes d'endomorphismes plutôt que de matrices. Les changements de base correspondent à des écritures matricielles différentes d'un même endomorphisme. Réduire un endomorphisme consiste à chercher une base dans laquelle sa matrice soit simple (dans l'idéal, diagonale). Nous commençons par réécrire les définitions que vous connaissez déjà.

Définition 6   Soit $ E$ un espace vectoriel de dimension $ n$ et $ f$ un endomorphisme de $ E$.
  1. Un nombre complexe $ \lambda$ est une valeur propre de $ f$ s'il existe un vecteur $ v\in E$ non nul, tel que $ f(v)=\lambda v$.
  2. Un vecteur $ v\in E$ est un vecteur propre de $ f$ associé à la valeur propre $ \lambda$ de $ f$ si $ v$ est non nul et $ f(v)=\lambda v$.
  3. Le sous-espace propre associé à la valeur propre $ \lambda$ est l'ensemble des vecteurs $ v$ tels que $ f(v)=\lambda v$, à savoir le noyau de l'endomorphisme $ f-\lambda \mathrm{I}$, où $ \mathrm{I}$ désigne l'identité de $ E$.
  4. On dit que $ f$ est diagonalisable s'il existe une base de $ E$ formée de vecteurs propres pour $ f$, ou encore si $ E$ est la somme directe des sous-espaces propres de $ f$ :

    $\displaystyle E= \mathop{\bigoplus}_{i=1}^k \mathrm{Ker}(f-\lambda_i\mathrm{I})\;.
$

  5. On appelle polynôme caractéristique de $ f$ le polynôme

    $\displaystyle P_f(X)=\mathrm{det}(f-X \mathrm{I})\;,
$

    dont les racines sont les valeurs propres de $ f$.

Rappelons que le déterminant d'un endomorphisme est celui de sa matrice dans une base quelconque de $ E$, et qu'il ne dépend pas de la base. Pour votre culture générale, le spectre d'un endomorphisme est l'ensemble de ses valeurs propres. Justifions maintenant le titre de cette section.

Notation 1   Soit $ P(X)=a_0+a_1X+\cdots+a_dX^d\in\mathbb{R}[X]$ un polynôme.
  1. Si $ f$ est un endomorphisme de $ E$, on note $ P(f)$ l'endomorphisme :

    $\displaystyle a_0 \mathrm{I}+a_1f+\cdots+a_df^d=\sum_{i=0}^d a_if^i\;,
$

    $ f^0=\mathrm{I}$ et pour tout $ i\geqslant 1$, $ f^i=f^{i-1}\circ f$.
  2. Si $ A\in{\cal M}_{n\times n}(\mathbb{R})$ est une matrice, on note $ P(A)$ la matrice :

    $\displaystyle a_0 I+a_1A+\cdots+a_dA^d=\sum_{i=0}^d a_iA^i\;,
$

    $ A^0=I$ et pour tout $ i\geqslant 1$, $ A^i=A^{i-1} A$.

Observez la cohérence des deux notations : si $ A$ est la matrice de $ f$ dans une certaine base, alors $ P(A)$ est celle de $ P(f)$ dans la même base. Remarquez aussi que deux polynômes du même endomorphisme commutent.

$\displaystyle \forall P,Q\in \mathbb{R}[X]\;,\quad P(f)\circ Q(f) = Q(f)\circ P(f)\;.
$

Les sous-espaces propres sont stables par $ f$, au sens de la définition suivante :

Définition 7   Soit $ f$ un endomorphisme de $ E$ et $ F$ un sous-espace vectoriel de $ E$. On dit que $ F$ est stable par $ f$ si $ f(F)\subset F$.

Proposition 3   Soient $ f$ et $ g$ deux endomorphismes qui commutent : $ f\circ
g=g\circ f$. Alors $ \mathrm{Im}(f)$ et $ \mathrm{Ker}(f)$ sont stables par $ g$.

Démonstration : Soit $ v$ un élément de $ \mathrm{Im}(f)$ : il existe $ u\in E$ tel que $ v=f(u)$. Alors $ g(v)=g(f(u))=f(g(u))$, donc $ g(v)\in\mathrm{Im}(f)$. Soit maintenant $ v\in\mathrm{Ker}(f)$ : $ f(g(v))=g(f(v))=g(0)=0$, donc $ g(v)\in \mathrm{Ker(f)}$.$ \square$ La conséquence est que les sous-espaces propres de $ f$ sont stables non seulement par $ f$, mais aussi par tous les $ P(f)$, quel que soit le polynôme $ P$. Les polynômes qui nous intéressent ici ont pour racines les valeurs propres de $ f$ : en premier lieu le polynôme caractéristique.

Théorème 4 (de Cayley-Hamilton)   Soit $ f$ un endomorphisme de $ \mathbb{R}^n$ et $ P_f$ son polynôme caractéristique. Alors $ P_f(f)$ est identiquement nul.

Démonstration : Choisissons une base quelconque de $ \mathbb{R}^n$. Soit $ A$ la matrice de $ f$ dans cette base. Nous allons démontrer que $ P_f(A)$ est la matrice nulle. Considérons la matrice $ A-X I$, dont $ P_f$ est le déterminant. Soit $ \widetilde{A-X I}$ sa comatrice, à savoir la matrice des cofacteurs (mineurs d'ordre $ n\!-\!1$ avec alternance de signe). On rappelle que :

$\displaystyle (A-X I) {^t\!(\widetilde{A-X I})} = P_f(X)  I\;.
$

Posons $ P_f(X)=a_0+a_1X+\cdots+a_nX^n$. Développons également $ {^t\!(\widetilde{A-X I})}$, comme un polynôme de degré $ n\!-\!1$, dont les coefficients sont des matrices :

$\displaystyle {^t\!(\widetilde{A-X I})} = C_0+C_1X+\cdots+C_{n-1}X^{n-1}\;,
$

$ C_0,\ldots,C_{n-1}\in {\cal M}_{n\times n}(\mathbb{R})$. L'identité rappelée ci-dessus devient :

$\displaystyle (A-XI)(C_0+C_1 X+\cdots+C_{n-1}X^{n-1}) = a_0 I+ (a_1I)X+\cdots+(a_nI) X^n\;.
$

Identifions alors les coefficients des deux polynômes :
$\displaystyle AC_0$ $\displaystyle =$ $\displaystyle a_0 I$  
$\displaystyle AC_1-C_0$ $\displaystyle =$ $\displaystyle a_1I$  
    $\displaystyle \vdots$  
$\displaystyle AC_i-C_{i-1}$ $\displaystyle =$ $\displaystyle a_i I$  
    $\displaystyle \vdots$  
$\displaystyle AC_{n-1}-C_{n-2}$ $\displaystyle =$ $\displaystyle a_{n-1} I$  
$\displaystyle -C_{n-1}$ $\displaystyle =$ $\displaystyle a_nI$  

Pour $ i=0,\ldots,n$, multiplions la $ i$-ième équation par $ A^i$ et ajoutons le tout. Le membre de gauche s'annule, et le membre de droite est $ P_f(A)$.$ \square$

Définition 8   Soit $ P\in\mathbb{R}[X]$ un polynôme. On dit que $ P$ est un polynôme annulateur de $ f$ si l'endomorphisme $ P(f)$ est identiquement nul.

Observons que tous les multiples d'un polynôme annulateur sont encore des polynômes annulateurs. D'après le théorème de Cayley-Hamilton, le polynôme caractéristique et tous ses multiples sont des polynômes annulateurs. Mais ce n'est pas tout.

Proposition 4   Il existe un polynôme unitaire unique, appelé polynôme minimal de $ f$ et noté $ \pi_f$, tel que tout polynôme annulateur de $ f$ est un multiple de $ \pi_f$.

Démonstration : Mettons que vous savez déjà que $ \mathbb{R}[X]$ est un anneau principal : les polynômes annulateurs forment un idéal propre. Cet idéal est donc engendré par un élément unique, fin de l'histoire. Euh... vous ne seriez pas contre une démonstration élémentaire ? Considérons l'ensemble des degrés des polynômes annulateurs non nuls :

$\displaystyle \{ \mathrm{deg}(P) ,\; P\in\mathbb{R}[X] ,\; P\neq 0 ,\;P(f)=0 \}\;.
$

C'est une partie de $ \mathbb{N}$ non vide : elle contient au moins $ n$, puisque le polynôme caractéristique est annulateur. Soit $ m$ son plus petit élément, et considérons un polynôme annulateur $ \pi$ de degré $ m$. Montrons que tout polynôme annulateur $ P$ est multiple de $ \pi$. Pour cela considérons la division euclidienne de $ P$ par $ \pi$ :

$\displaystyle P=\pi Q+R\;,
$

$ \mathrm{deg}(R)\leqslant m-1$. Mais si $ P(f)=0$ et $ \pi(f)=0$, alors $ R(f)=0$. Si $ R$ était non nul, ce serait un polynôme annulateur de degré strictement inférieur à $ m$, ce qui contredirait la définition de $ m$. Donc $ R$ est nul et $ P$ est multiple de $ \pi$. Si $ \pi_1$ et $ \pi_2$ sont deux polynômes annulateurs de même degré $ m$, ils sont multiples l'un de l'autre. Ils diffèrent donc par une constante multiplicative. D'où l'unicité, si on suppose que le coefficient du terme de plus haut degré est $ 1$ (polynôme unitaire).$ \square$

Proposition 5   Soit $ f$ un endomorphisme, dont le polynôme caractéristique est scindé.

$\displaystyle P_f(X)=(-1)^k\prod_{i=1}^k(X-\lambda_i)^{m_i}\;.
$

Son polynôme minimal est :

$\displaystyle \pi_f = \prod_{i=1}^k(X-\lambda_i)^{l_i}\;,
$

où pour tout $ i=1,\ldots,k$, $ 1\leqslant l_i\leqslant m_i$.

Démonstration : D'après le théorème de Cayley-Hamilton et la définition du polynôme minimal, celui-ci divise le polynôme caractéristique. Puisque les polynômes de degré $ 1$ sont irréductibles,

$\displaystyle \pi_f = \prod_{i=1}^k(X-\lambda_i)^{l_i}\;,
$

où pour tout $ i=1,\ldots,k$, $ 0\leqslant l_i\leqslant m_i$. Nous devons simplement démontrer que $ l_i>0$ pour tout $ i$. Soit $ v$ un vecteur propre de $ f$ associé à la valeur propre $ \lambda_i$. Alors $ (f-\lambda_j\mathrm{I})(v)=(\lambda_i-\lambda_j)v$, qui est nul si $ i=j$, non nul $ i\neq j$. Donc

$\displaystyle \pi_f(v) = \left(\prod_{j=1}^k(\lambda_i-\lambda_j)^{l_j}\right) v \;.
$

Or par définition $ \pi_f(v)$ doit être nul, donc l'exposant $ l_i$ est bien strictement positif (s'il était nul, $ \pi_f(v)$ serait égal à $ v$ multiplié par un produit de termes non nuls).$ \square$ Un exemple élémentaire vous aidera à comprendre la différence entre polynôme minimal et polynôme caractéristique. Supposons que $ f$ soit l'homothétie de rapport $ \lambda$, soit $ f=\lambda\mathrm{I}$. La matrice de $ f$ dans n'importe quelle base est diagonale, avec des $ \lambda$ sur la diagonale. Le polynôme caractéristique de $ f$ est $ P_f=(\lambda-X)^n$, alors que son polynôme minimal est $ \pi_f = (X-\lambda)$, puisque $ f=\lambda\mathrm{I}$. Or justement, la diagonalisation consiste à écrire une somme directe de sous-espaces propres, pour chacun desquels la restriction de $ f$ est une homothétie.

Théorème 5   Soit $ f$ un endomorphisme, dont le polynôme caractéristique est scindé.

$\displaystyle P_f(X)=(-1)^k\prod_{i=1}^k(X-\lambda_i)^{m_i}\;.
$

L'endomorphisme est diagonalisable si et seulement si ses valeurs propres $ \lambda_1,
\ldots,\lambda_k$ sont racines simples de son polynôme minimal.

$\displaystyle \pi_f = \prod_{i=1}^k(X-\lambda_i)\;.
$

Démonstration : Considérons le polynôme $ \pi=\prod_{j=1}^k(X-\lambda_j)$. Soit $ v$ un vecteur propre de $ f$, associé à la valeur propre $ \lambda_i$. L'image de $ v$ par $ \pi(f)$ est :

$\displaystyle \pi(f)(v) = \left(\prod_{j=1}^k(\lambda_i-\lambda_j)\right) v=0\;.
$

Si $ f$ est diagonalisable, alors il existe une base de vecteurs propres. Si un endomorphisme s'annule sur tous les éléments d'une base, il est identiquement nul. Donc le polynôme $ \pi$ est annulateur, donc multiple de $ \pi_f$. Or par la proposition précédente, $ \pi$ divise $ \pi_f$. Donc $ \pi=\pi_f$. Réciproquement, supposons que le polynôme minimal de $ f$ soit

$\displaystyle \pi_f = \prod_{i=1}^k(X-\lambda_i)\;.
$

Notons $ E_i$ le sous-espace propre de $ f$ associé à la valeur propre $ \lambda_i$ : $ E_i=\mathrm{Ker}(f-\lambda_i\mathrm{I})$. Nous voulons démontrer que $ E=\mathop{\bigoplus}_{i=1}^k E_i$. Nous avons déjà observé qu'un même vecteur ne peut pas être dans deux sous-espaces propres différents : les intersections deux à deux des sous-espaces propres sont réduites à $ \{0\}$, donc la somme des $ E_i$ est directe. Nous devons simplement démontrer que tout vecteur de $ E$ est une somme de vecteurs propres. Écrivons :

$\displaystyle \frac{1}{\prod_{i=1}^k(X-\lambda_i)} =
\sum_{i=1}^k \left(\frac{1}{\prod_{j\neq i}
(\lambda_i-\lambda_j)}\right)\frac{1}{X-\lambda_i}\;.
$

C'est la décomposition en éléments simples de la fraction rationnelle $ 1/\prod_{i=1}^k(X-\lambda_i)$ (juste pour que vous sachiez d'où vient cette formule parachutée). En multipliant par le dénominateur du membre de gauche :

$\displaystyle 1 =
\sum_{i=1}^k \left(\frac{1}{\prod_{j\neq
i}(\lambda_i-\lambda_j)}\right)\prod_{j\neq i} (X-\lambda_j)\;.
$

Ceci est l'écriture du polynôme constant $ 1$ sur la base des polynômes interpolateurs de Lagrange (vous n'avez pas besoin de le savoir pour comprendre la suite, c'est beau voilà tout). Posons alors pour tout $ i=1,\ldots,k$ :

$\displaystyle \alpha_i=\frac{1}{\prod_{j\neq
i}(\lambda_i-\lambda_j)}
\quad\mbox{et}\quad
P_i(X) = \prod_{j\neq i} (X-\lambda_j)\;.
$

Ainsi :

$\displaystyle 1=\sum_{i=1}^k \alpha_iP_i(X)\;.
$

Composons par $ f$ (cf. notation 1) :

$\displaystyle \mathrm{I} = \sum_{i=1}^k \alpha_i P_i(f)\;.
$

Donc pour tout vecteur $ v\in E$ :

$\displaystyle v = \sum_{i=1}^k \alpha_i P_i(f)(v)\;.
$

Il nous reste à démontrer que pour tout $ i=1,\ldots,n$, $ P_i(f)(v)\in E_i$. Par hypothèse, $ \pi_f(X)=(X-\lambda_i)P_i(X)$. Donc :

$\displaystyle \pi_f(f)(v) = (f-\lambda_i \mathrm{I})(P_i(f)(v))=0\;.
$

Nous avons démontré que tout vecteur de $ E$ s'écrit comme somme de vecteurs des sous-espaces propres. Donc $ E$ est la somme des sous-espaces propres. Nous savions déjà que la somme des $ E_i$ est directe, donc $ E=\mathop{\bigoplus}_{i=1}^k E_i$.$ \square$ Voici quelques exemples pour terminer cette section.

Définition 9   Soient $ F$ et $ G$ deux sous-espaces vectoriels de $ E$, tels que $ E=F\oplus G$ : tout vecteur $ v\in E$ s'écrit de manière unique comme la somme d'un vecteur de $ F$ et d'un vecteur de $ G$.

$\displaystyle \forall u\in E ,\;\exists ! (v,w)\in F\times G\;,\quad
u=v+w\;.
$

$ \bullet$
La projection sur $ F$ parallèlement à $ G$ est l'application $ p$ qui à $ u$ associe $ p(u)=v$.
$ \bullet$
La symétrie par rapport à $ F$ parallèlement à $ G$ est l'application $ s$ qui à $ u$ associe $ s(u)=v-w$.

La figure 1 vous aidera à visualiser cette définition.
Figure 1: Somme directe $ E=F\oplus G$, projection sur $ F$, et symétrie par rapport à $ F$.
\includegraphics[width=10cm]{projsym}

Proposition 6   Soient $ F$ et $ G$ deux sous-espaces vectoriels de $ E$, de dimensions respectives $ k$ et $ n\!-\!k$, tels que $ E=F\oplus G$. La projection $ p$ et la symétrie $ s$ sur $ F$ parallèlement à $ G$ sont diagonalisables. Leurs polynômes minimaux et caractéristiques sont :

$\displaystyle P_p(X) = (-1)^nX^{n-k}(X-1)^k$   et$\displaystyle \quad \pi_p(X)=X(X-1)$

$\displaystyle P_s(X) = (-1)^n(X+1)^{n-k}(X-1)^k$   et$\displaystyle \quad \pi_s(X)=(X+1)(X-1)$

Démonstration : Formons une base de $ E$ en concaténant une base de $ F$ et une base de $ G$. Les matrices de $ p$ et $ s$ dans cette base sont diagonales :

$\displaystyle \left(\begin{array}{cccccc}
1&0&\ldots&&\ldots&0\\
0&\ddots&\ddo...
...s&\vdots\\
\vdots&&&\ddots&\ddots&0\\
0&\ldots&&\ldots&0&0
\end{array}\right)$   et$\displaystyle \quad
\left(\begin{array}{cccccc}
1&0&\ldots&&\ldots&0\\
0&\ddot...
...dots\\
\vdots&&&\ddots&\ddots&0\\
0&\ldots&&\ldots&0&-\!1
\end{array}\right)
$

Les polynômes caractéristiques s'en déduisent immédiatement. Les polynômes minimaux aussi, en utilisant le théorème précédent : il n'y a que deux valeurs propres, $ 1$ et 0 pour la projection, $ 1$ et $ -\!1$ pour la symétrie. On peut aussi observer que la projection vérifie $ p\circ p=p$, soit $ p^2-p=0$ ; la symétrie vérifie $ s\circ s=\mathrm{I}$, soit $ s^2-\mathrm{I}=0$. $ \square$

Définition 10   On dit qu'un endomorphisme $ f$ est nilpotent d'indice $ k$ si $ f^k=0$ et $ f^{k-1}\neq 0$.

Proposition 7   Soit $ f$ un endomorphisme nilpotent d'indice $ k$. Son polynôme caractéristique est $ (-1)^nX^n$, son polynôme minimal est $ X^k$. Si $ k>1$, $ f$ n'est pas diagonalisable.

Démonstration : Puisque $ X^k$ est un polynôme annulateur, le polynôme minimal divise $ X^k$. Mais comme $ f^{k-1}\neq 0$, $ \pi_f$ ne peut pas être de degré inférieur à $ k$. Donc $ \pi_f=X^k$. L'endomorphisme $ f$ n'a pas d'autre valeur propre que 0, donc le polynôme caractéristique est multiple de $ X^n$. $ \square$

Proposition 8   Soit $ f$ un endomorphisme tel que sa matrice dans une certaine base soit :

\begin{displaymath}
A=\left(
\begin{array}{cccccc}
0&0&\ldots&\ldots&0&a_0\\
1&...
...ts&0&a_{n-2}\\
0&\ldots&\ldots&0&1&a_{n-1}
\end{array}\right)
\end{displaymath}

Son polynôme caractéristique est :

$\displaystyle P_f(X) = (-1)^{n}(X^n-a_{n-1}X^{n-1}-\cdots-a_1X-a_0)\;.
$

Son polynôme minimal est :

$\displaystyle \pi_f(X) = (-1)^n P_f(X) = X^n-a_{n-1}X^{n-1}-\cdots-a_1X-a_0\;.
$

La matrice $ A$ est appelée matrice de Frobenius ou matrice compagnon du polynôme $ P_f=(-1)^n\pi_f$. Démonstration : Le calcul du polynôme caractéristique s'effectue en développant selon la première ligne pour faire apparaître une formule de récurrence ; nous vous le laissons en exercice, si vous ne l'avez pas déjà vu dans le chapitre «Déterminants». Considérons la base $ (e_1,\ldots,e_n)$ dans laquelle la matrice de $ f$ est $ A$. Par définition,

$\displaystyle f(e_1)=e_2, f(e_2)=f^2(e_1)=e_3,\ldots, f(e_{n-1})=f^{n-1}(e_1)=e_n\;.
$

Soit $ P(X)=b_0+b_1X+\cdots+b_{n-1}X^{n-1}$ un polynôme quelconque, de degré au plus $ n\!-\!1$. Alors :

$\displaystyle P(f)(e_1)=b_0e_1+b_1f(e_1)+\cdots+b_{n-1}f^{n-1}(e_1)=b_0e_1+b_1e_2+\cdots+b_{n-1}e_n\;.
$

Si $ P$ est un polynôme annulateur de $ f$, alors $ P(f)(e_1)=0$, mais comme $ (e_1,\ldots,e_n)$ est une base, ceci entraîne que $ b_0=\ldots=b_{n-1}=0$. Un polynôme annulateur de degré strictement inférieur à $ n$ est nul. Tout polynôme annulateur non nul est donc de degré supérieur ou égal à $ n$, donc multiple de $ P_f$ (cf. proposition 4). $ \square$

         © UJF Grenoble, 2011                              Mentions légales