Produit scalaire et orthogonalité

Commençons par la définition d'un produit scalaire.

Définition 9   Soit $ E$ un espace vectoriel. Soit $ S$ une application de $ E\times E$ dans $ \mathbb{R}$. On dit que l'application $ S$ est un produit scalaire si elle est :
  1. symétrique: pour tous vecteurs $ \vec{u}$, $ \vec{v}$,

    $\displaystyle S(\vec{u},\vec{v})
=S(\vec{v},\vec{u})\;;
$

  2. bilinéaire: pour tous vecteurs $ \vec{u}$, $ \vec{v}$, $ \vec{w}$ et tous réels $ \lambda$, $ \mu$,

    \begin{displaymath}
\begin{array}{lcl}
S(\vec{u},(\lambda\vec{v}+\mu\vec{w}))
&=...
...ambda S(\vec{u},\vec{w})
+\mu S(\vec{v},\vec{w})\;;
\end{array}\end{displaymath}

  3. définie positive: pour tout vecteur $ \vec{u}$,

    $\displaystyle S(\vec{u},\vec{u})\geq 0$   et$\displaystyle \quad
S(\vec{u},\vec{u})= 0\Longleftrightarrow
\vec{u}=\vec{0}\;.
$

Observez que si $ S$ est symétrique, et linéaire par rapport à l'une des composantes, elle est nécessairement linéaire par rapport à l'autre.

Soit $ E$ un espace vectoriel de dimension $ n$, muni d'une base $ (\vec{u}_1,\ldots,\vec{u}_n)$. Soient $ \vec{u}$ et $ \vec{v}$ deux vecteurs de $ E$.

$\displaystyle \vec{u} = \sum_{i=1}^n x_i  \vec{u}_i$   et$\displaystyle \quad
\vec{v} = \sum_{i=1}^n y_i  \vec{u}_i
$

On appelle produit scalaire de $ \vec{u}$ et $ \vec{v}$ relatif à la base $ (\vec{u}_1,\ldots,\vec{u}_n)$, et on note $ \vec{u}\cdot\vec{v}$ la somme des produits deux à deux des coordonnées.

$\displaystyle \vec{u}\cdot\vec{v} = \sum_{i=1}^n x_iy_i\;.
$

Il est immédiat de vérifier que le produit scalaire relatif à une base, vérifie bien la définition 9. On démontre que si $ S$ est un produit scalaire au sens de la définition 9, sur un espace de dimension finie, alors il existe une base $ {\cal B}$ telle que $ S$ soit le produit scalaire relatif à la base $ {\cal B}$. En dimension finie, quitte à changer de base, on se ramène donc toujours au cas où le produit scalaire est la somme des produits deux à deux des coordonnées. Nous noterons donc désormais $ \vec{u}\cdot\vec{v}$ le produit scalaire de deux vecteurs, comme vous en avez l'habitude. Dans un espace vectoriel, la donnée d'un produit scalaire induit les notions d'orthogonalité, et de norme.

Définition 10   Soit $ E$ un espace vectoriel muni d'un produit scalaire.
  1. On dit que deux vecteurs $ \vec{u}$ et $ \vec{v}$ de $ E$ sont orthogonaux si leur produit scalaire est nul.
  2. On appelle norme d'un vecteur $ \vec{u}$ de $ E$, et on note $ \Vert\vec{u}\Vert$ la racine carrée du produit scalaire de $ u$ par lui même.

    $\displaystyle \Vert\vec{u}\Vert=\sqrt{\vec{u}\cdot
\vec{u}}\;.
$

Comme conséquence du fait qu'un produit scalaire est défini positif, la norme d'un vecteur ne peut être nulle que si ce vecteur est nul. De même, si deux vecteurs sont à la fois orthogonaux et colinéaires alors l'un d'entre eux est le vecteur nul ; ou de manière équivalente, si deux vecteurs non nuls sont orthogonaux, ils ne sont pas colinéaires. Considérons un espace vectoriel de dimension $ n$, muni d'une base $ (\vec{u}_1,\ldots,\vec{u}_n)$ et notons $ \vec{u}\cdot\vec{v}$ le produit scalaire relatif à cette base.

Dans la base $ (\vec{u}_1,\ldots,\vec{u}_n)$, le vecteur $ \vec{u}_i$ a toutes ses coordonnées nulles, sauf la $ i$-ième qui vaut $ 1$. On vérifie donc immédiatement que $ \vec{u}_i$ a pour norme $ 1$ et que $ \vec{u}_i$ et $ \vec{u}_j$ sont orthogonaux pour $ i\neq j$. On dit que la base est orthonormée.

Définition 11   Soit $ E$ un espace vectoriel de dimension $ n$, muni d'un produit scalaire. On dit que la base $ (\vec{u}_1,\ldots,\vec{u}_n)$ est orthonormée, si les vecteurs sont orthogonaux deux à deux, et chacun d'eux est de norme $ 1$.

$\displaystyle \forall i,j=1,\ldots,n\;,\quad\vec{u}_i\cdot
\vec{u}_j=
\left\{\begin{array}{ll}
0&\mbox{si }i\neq j\\
1&\mbox{si }i=j\;.
\end{array}\right.
$

Tel que nous l'avons défini, le produit scalaire semble dépendre de la base. La proposition suivante montre que si on remplace la base initiale par une autre base orthonormée, le produit scalaire garde la même écriture.

Proposition 8   Soient $ \vec{u}$ et $ \vec{v}$ deux vecteurs d'un espace vectoriel $ E$ de dimension $ n$, et $ \vec{u}\cdot\vec{v}$ leur produit scalaire relatif à la base $ (\vec{u}_1,\ldots,\vec{u}_n)$. Soit $ (\vec{u}_1',\ldots,\vec{u}_n')$ une autre base orthonormée. Soient $ (x'_1,\ldots,x'_n)$ et $ (y'_1,\ldots,y'_n)$ les coordonnées respectives de $ \vec{u}$ et $ \vec{v}$ dans cette nouvelle base. Alors:

$\displaystyle \vec{u}\cdot\vec{v}
=
\sum_{i=1}^n x'_iy'_i\;.
$

Démonstration : En utilisant la bilinéarité:

\begin{displaymath}
\begin{array}{lcl}
\vec{u}\cdot\vec{v}&=&
\displaystyle{\lef...
... [2ex]
&=&
\displaystyle{
\sum_{i=1}^n x'_iy'_i\;,}
\end{array}\end{displaymath}

car puisque la base est orthonormée,

$\displaystyle \vec{u}'_i\cdot \vec{u}'_i=1$   et$\displaystyle \quad
\vec{u}'_i\cdot\vec{u}'_j=0$    si $\displaystyle i\neq j\;.
$

$ \square$

Voici un résultat souvent utile, l'inégalité de Cauchy-Schwarz.

Théorème 3   Soit $ \vec{u}$ et $ \vec{v}$ deux vecteurs.

$\displaystyle \vert\vec{u}\cdot\vec{v}\vert \leq \Vert\vec{u}\Vert \Vert\vec{v}\Vert\;,$ (8)

l'égalité ayant lieu si et seulement si $ \vec{u}$ et $ \vec{v}$ sont colinéaires.

Démonstration : Soit $ x$ un réel quelconque. Calculons le produit scalaire du vecteur $ x\vec{u}+\vec{v}$ par lui-même, en utilisant la bilinéarité et la symétrie:

$\displaystyle (x\vec{u}+\vec{v})\cdot
(x\vec{u}+\vec{v})
=x^2(\vec{u}\cdot\vec{u})
+2x(\vec{u}\cdot\vec{v})
+(\vec{v}\cdot\vec{v})
$

Cette expression est un polynôme du second degré en $ x$. Or pour tout $ x$, il prend une valeur positive ou nulle. Son discriminant ne peut pas être strictement positif, car sinon le polynôme aurait deux racines réelles entre lesquelles il prendrait des valeurs négatives. Ecrire que le discriminant est négatif ou nul donne:

$\displaystyle (\vec{u}\cdot\vec{v})^2\leq
(\vec{u}\cdot\vec{u}) 
(\vec{v}\cdot\vec{v})\;,
$

soit

$\displaystyle (\vec{u}\cdot\vec{v})^2\leq
\Vert\vec{u}\Vert^2 
\Vert\vec{v}\Vert^2\;,
$

ce qui entraîne (8). L'égalité a lieu si et seulement si le trinôme admet une racine double $ x$, valeur pour laquelle $ x\vec{u}+\vec{v}$ est le vecteur nul. $ \square$

Passons maintenant à l'espace affine. Rappelons qu'un repère est constitué d'une origine $ O$ et d'une base de l'espace vectoriel associé. Dire qu'on munit l'espace d'un repère orthonormé, c'est supposer implicitement qu'on dispose d'un produit scalaire, pour lequel les vecteurs de la base sont orthogonaux deux à deux, et de norme $ 1$. Ceci permet de définir la distance euclidienne.

Définition 12   Soit $ {\cal E}$ un espace affine, muni d'un repère orthonormé. On appelle distance euclidienne de deux points $ A$ et $ B$, et on note $ d(A,B)$, la norme du vecteur $ \overrightarrow{AB}$.

Vous apprendrez plus tard qu'il existe de multiples manières de définir une distance dans un espace. Pour l'instant, nous n'utiliserons que celle-ci, et nous omettrons l'adjectif «euclidienne». L'inégalité de Cauchy-Schwarz montre que le rapport entre le produit scalaire de deux vecteurs non nuls et le produit de leurs normes est compris entre $ -1$ et $ 1$. Ce rapport est interprété comme le cosinus de l'angle que forment les deux vecteurs.

$\displaystyle \overrightarrow{OA}\cdot\overrightarrow{OB} = d(O,A)d(O,B)\cos(\widehat{AOB})\;.$ (9)

Cette interprétation permet de retrouver tous les résultats classiques de la géométrie plane ; par exemple le théorème suivant, dit théorème d'Al-Kashi (figure 4).

Théorème 4   Soient $ A,B,C$ trois points du plan et $ \alpha$ l'angle des deux vecteurs $ \overrightarrow{AB}$, $ \overrightarrow{AC}$.

$\displaystyle d^2(B,C) = d^2(A,B)+d^2(A,C)-2d(A,B)d(A,C)\cos(\alpha)\;.
$

Le cas particulier où le triangle est rectangle en $ A$ ( $ \cos(\alpha)=0$) est le théorème du regretté Pythagore. Démonstration : La relation de Chasles donne :

$\displaystyle \overrightarrow{BC} = \overrightarrow{AC}-\overrightarrow{AB}\;.
$

En utilisant la bilinéarité du produit scalaire, on écrit:

\begin{displaymath}
\begin{array}{lcl}
\Vert\overrightarrow{BC}\Vert^2&=&
(\over...
...ert\cos(\alpha)
+\Vert\overrightarrow{AB}\Vert^2\;.
\end{array}\end{displaymath}

$ \square$
Figure: Le théorème d'Al-Kashi: $ a^2=b^2+c^2-2bc\cos(\alpha)$.
\includegraphics[width=7cm]{triangle}
Définir rigoureusement la notion d'angle de deux vecteurs pose un problème de choix d'orientation. En dimension $ 2$ les angles sont mesurés de 0 à $ 2\pi$, dans le sens trigonométrique. En dimension $ 3$, parler d'angle dans un plan suppose qu'on a défini une orientation du plan, ce qui peut se faire si on a défini une orientation de l'espace, et une orientation normale du plan. Deux ensembles de vecteurs sont dits orthogonaux si tout vecteur de l'un est orthogonal à tout vecteur de l'autre. Nous examinons le cas particulier de deux droites vectorielles dans un plan. Observons que, du fait de la bilinéarité, si deux vecteurs sont orthogonaux, tout vecteur colinéaire à l'un est orthogonal à tout vecteur colinéaire à l'autre.

$\displaystyle \vec{u}\cdot\vec{v}=0
\;\Longrightarrow\;
\forall \lambda,\mu\in\...
...} ,\;
(\lambda\vec{u})\cdot(\mu\vec{v})=
\lambda\mu(\vec{u}\cdot\vec{v})=0\;.
$

Réciproquement, l'ensemble des vecteurs du plan, orthogonaux à un vecteur donné est une droite vectorielle.

Définition 13   On dit que deux droites du plan affine sont orthogonales (ou perpendiculaires) si tout vecteur directeur de l'une est orthogonal à tout vecteur directeur de l'autre.

La projection orthogonale utilise le fait qu'il existe une seule perpendiculaire à une droite donnée passant par un point extérieur à cette droite (figure 5).

Définition 14   Soit $ {\cal D}$ une droite et $ A$ un point du plan, n'appartenant pas à $ {\cal D}$. on appelle projection orthogonale de $ A$ sur $ {\cal D}$ le point d'intersection de $ {\cal D}$ avec la droite orthogonale à $ {\cal D}$ passant par $ A$. On appelle distance du point $ A$ à la droite $ {\cal D}$ la distance du point à sa projection orthogonale sur la droite.

On étend cette définition de façon évidente aux points de $ {\cal D}$: la projection orthogonale d'un point de $ {\cal D}$ sur $ {\cal D}$ est le point lui-même, et sa distance à $ {\cal D}$ est nulle. Le théorème de Pythagore entraîne que la distance d'un point à une droite est la plus petite des distances de ce point à un point de la droite. Dans le cas où la droite est définie par une équation implicite, la distance d'un point à cette droite se calcule très simplement.

Proposition 9   Considérons le plan muni d'un repère orthonormé $ (O,\vec{\imath},\vec{\jmath})$. Soit $ {\cal D}$ la droite d'équation implicite $ ax+by+c=0$, et $ A$ le point de coordonnées $ (x_A,y_A)$. La distance du point $ A$ à la droite $ {\cal D}$ est:

$\displaystyle \frac{\vert ax_A+by_A+c\vert}{\sqrt{a^2+b^2}}\;.
$

Démonstration : Si $ A\in {\cal D}$ la distance est nulle, et la formule est vraie. Supposons maintenant que le point $ A$ n'appartienne pas à la droite $ {\cal D}$ (figure 5). Le vecteur de coordonnées $ (a,b)$, que nous noterons $ \vec{n}$, est orthogonal au vecteur de coordonnées $ (-b,a)$, qui est un vecteur directeur de la droite ($ \vec{n}$ pour «normal» : un autre synonyme d'orthogonal). Notons $ H$ la projection orthogonale de $ A$ sur $ {\cal D}$. Tout point $ M$ de la droite vérifie :

$\displaystyle \overrightarrow{AM}\cdot\vec{n} =
(\overrightarrow{HM}-\overrightarrow{HA})\cdot\vec{n} =
-\overrightarrow{HA}\cdot\vec{n}\;,
$

car $ \overrightarrow{HM}$ et $ \vec{n}$ sont orthogonaux. Comme $ \overrightarrow{HA}$ et $ \vec{n}$ sont colinéaires, la valeur absolue de leur produit scalaire est le produit des normes. On obtient donc :

$\displaystyle \vert\overrightarrow{AM}\cdot\vec{n}\vert =
\Vert\overrightarrow{HA}\Vert \Vert\vec{n}\Vert\;.
$

Par définition, $ \Vert\overrightarrow{HA}\Vert$ est la distance de $ A$ à la droite, et $ \Vert\vec{n}\Vert=\sqrt{a^2+b^2}$. Il reste à évaluer le produit scalaire de $ \overrightarrow{AM}$ par $ \vec{n}$.

$\displaystyle \overrightarrow{AM}\cdot\vec{n}=a(x_M-x_A)+b(x_M-x_A)
=-(ax_A+bx_A+c)\;,
$

car $ ax_M+bx_M+c=0$. D'où le résultat.$ \square$
Figure 5: Projection orthogonale d'un point sur une droite.
\includegraphics[width=7cm]{projection}
Les notions de projection orthogonale et de distance sont définies de la même façon en dimension $ 3$. Soient deux vecteurs $ \vec{u}$ et $ \vec{v}$, non colinéaires, et $ P$ le plan vectoriel qu'ils engendrent.

$\displaystyle P = \{ \lambda\vec{u}+\mu\vec{v}
 ,\;\lambda,\mu\in\mathbb{R} \}\;.
$

Nous avons introduit à la section précédente les trois coefficients :

$\displaystyle a=y_uz_v -y_vz_u \;,\quad b=z_ux_v -z_vx_u \;,\quad c=x_uy_v -x_vy_u\;.$

Ce sont trois déterminants. Puisque $ \vec{u}$ et $ \vec{v}$ ne sont pas colinéaires, la proposition 1 entraîne que $ a,b,c$ ne sont pas tous les trois nuls. Les deux relations :

$\displaystyle ax_u+by_u +cz_u=0$   et$\displaystyle \quad
ax_v+by_v
+cz_v=0
$

montrent que le vecteur $ \vec{n}$ de coordonnées $ (a,b,c)$ est orthogonal à $ \vec{u}$ et à $ \vec{v}$ (voir lemme 1). La bilinéarité du produit scalaire entraîne que $ \vec{n}$ est orthogonal à tout vecteur de $ P$. Réciproquement, tout vecteur orthogonal à $ \vec{n}$ est combinaison linéaire de $ \vec{u}$ et $ \vec{v}$, et donc appartient à $ P$.

Proposition 10   Dans un espace affine de dimension $ 3$, l'ensemble des points de coordonnées $ x,y,z$ tels que :

$\displaystyle ax+by+cz+d=0\;,
$

est un plan affine, dont le plan vectoriel associé est l'ensemble des vecteurs orthogonaux au vecteur $ \vec{n}$, de coordonnées $ (a,b,c)$.

Soit $ {\cal P}$ un plan affine dans un espace de dimension $ 3$, et $ A$ un point n'appartenant pas à $ {\cal P}$. La projection orthogonale de $ A$ sur $ {\cal P}$ est l'intersection avec $ {\cal P}$ de la droite passant par $ A$ et de vecteur directeur $ \vec{n}$ (la perpendiculaire à $ {\cal P}$ passant par $ A$). La distance d'un point à un plan défini par une équation implicite se calcule par une formule analogue à celle de la proposition 9.

Proposition 11   Considérons un espace affine $ {\cal E}$ de dimension $ 3$, muni d'un repère orthonormé $ (O,\vec{\imath},\vec{\jmath},\vec{k})$. Dans ce repère, soit $ {\cal P}$ le plan d'équation implicite $ ax+by+cz+d=0$, et $ A$ le point de coordonnées $ (x_A,y_A,z_A)$. La distance du point $ A$ au plan $ {\cal P}$ est:

$\displaystyle \frac{\vert ax_A+by_A+cz_A+d\vert}{\sqrt{a^2+b^2+c^2}}\;.
$


         © UJF Grenoble, 2011                              Mentions légales