Analyse-Synthèse pour E = F ⊕ G

Prouver qu’un espace vectoriel est la somme directe de deux (ou plusieurs) sous-espaces est une question omniprésente dans le programme d’algèbre linéaire des deux premières années d’enseignement supérieur scientifique. Elle se traite généralement en raisonnant par analyse-synthèse.

Cet article tâchera de faire le point sur cette question, en partant de zéro (ou presque).

1 – Quelques rappels de cours

Dans ce qui suit, \mathbb{K} et E désignent respectivement un corps et un \mathbb{K}-espace vectoriel.

Le plus souvent, \mathbb{K}=\mathbb{R} ou \mathbb{C}. Plus rarement, \mathbb{K}=\mathbb{Q} ou \mathbb{Z}/p\mathbb{Z} (avec p premier).

Définition 1

Etant donnés deux sous-espaces vectoriels F et G de E, on note :

    \[F+G=\{x+y;\,x\in F\text{ et }y\in G\}\]

On dit que F+G est la somme des deux sous-espaces F et G.

On vérifie aisément que F+G est un sous-espace vectoriel de E.

Il ne faut pas confondre F+G avec F\cup G qui, en général, n’est pas un sous-espace vectoriel. Il est cependant facile de voir que F+G est le sous-espace engendré par F\cup G (preuve en annexe).

Comme le montre l’exemple qui suit, il faut s’attendre à ce qu’un vecteur z\in F+G puisse généralement s’exprimer de plusieurs manières sous la forme x+y avec x\in F et y\in G.

Exemple

Considèrons le \mathbb{R}-espace vectoriel \mathbb{R}^3 et ses deux sous-espaces :

    \[F=\{(0,y,z)\in\mathbb{R}^3;\,(y,z)\in\mathbb{R}^2\}\]

et

    \[G=\{(x,0,z)\in\mathbb{R}^3;\,(x,z)\in\mathbb{R}^2\}\]

On constate que, pour tout a\in\mathbb{R} :

    \[(0,0,0)=(0,0,a)+(0,0,-a)\]

ce qui montre l’existence d’une infinité de décompositions du vecteur nul de \mathbb{R}^3 comme somme d’un vecteur de F et d’un vecteur de G.

Ceci nous conduit naturellement à la définition suivante :

Définition 2

On conserve les notations introduites plus haut.

La somme F+G est dite directe lorsque tout vecteur z\in F+G peut s’exprimer d’une seule façon sous la forme x+y avec x\in F et y\in G.

On note alors F\oplus G.

Il faut bien voir que F\oplus G désigne exactement le même objet mathématique que F+G, mais avec l’information supplémentaire ( 🙂 jeu de mots) indiquée dans la définition ci-dessus.

Proposition (caractérisation d’une somme directe)

Etant donnés deux sous-espaces F et G de E, les trois assertions suivantes sont équivalentes :

  1. La somme F+G est directe
  2. F\cap G=\{0_E\}
  3. Pour tout (x,y)\in F\times G, si x+y=0_E alors x=y=0_E
Preuve (cliquer pour déplier / replier)

\boxed{(1)\Rightarrow(2)}

Si z\in F\cap G, alors z peut s’exprimer comme la somme d’un vecteur de F et d’un vecteur de G comme ceci :

    \[z=z+0_E\]

et comme cela :

    \[z=0_E+z\]

Mais en raison de l’hypothèse (1), ces deux écritures sont confondues et donc z=0_E. Ceci prouve que F\cap G\subset\{0_E\} et l’inclusion réciproque est triviale.

\boxed{(2)\Rightarrow(3)}

Soit (x,y)\in F\times G tel que x+y=0_E. On observe que :

    \[x=-y\in G\]

(car G est stable par combinaison linéaire et, a fortiori, par passage à l’opposé) et donc x\in F\cap G.

Il en résulte (d’après (2)) que x=y=0_E.

\boxed{(3)\Rightarrow(1)}

Soient (x,x')\in F^2 et (y,y')\in G^2 tels que x+y=x'+y'.

Alors (x-x')+(y-y')=0_E et comme x-x'\in F et y-y'\in G, il résulte de l’hypothèse (3) que x-x'=y-y'=0_E.

Moralité : x=x', y=y' et l’on a prouvé que la somme F+G est directe.

Lorsque deux sous-espaces F et G de E sont en somme directe, il se peut que cette somme directe soit égale à E tout entier … ou pas !

Définition 3

Deux sous-espace F et G de E sont dits supplémentaires lorsque :

    \[E=F\oplus G\]

ce qui signifie que tout vecteur de E peut s’exprimer, de manière unique, comme la somme d’un vecteur de F et d’un vecteur de G.

A priori, la preuve d’une égalité du type E=F\oplus G doit comporter trois points :

  • Point 0 : prouver que F+G\subset E.
  • Point 1 : prouver que E\subset F+G.
  • Point 2 : prouver que la somme F+G est directe.

Mais le point 0 est sans objet ! En effet, l’inclusion F+G\subset E est évidente puisque F,G sont des sous-espaces de E,

Il ne reste donc que deux points, le second pouvant être reformulé grâce à la proposition démontrée plus haut :

  • Point 1 : prouver que E\subset F+G.
  • Point 2 : prouver que F\cap G=\{0_E\}.

Le premier point soulève généralement une difficulté spécifique …

On doit en effet se donner un vecteur quelconque z\in E et prouver l’existence de vecteurs x\in F et y\in G tels que z=x+y. Mais selon le contexte, il peut ne pas être évident d’aller dénicher deux tels vecteurs x et y

Cependant, puisqu’au final il doit exister (pour un z\in E donné) un unique couple (x,y)\in F\times G vérifiant x+y=z, il doit y avoir un moyen de lui mettre la main dessus sans avoir à jouer aux devinettes !

Ce moyen est un mode de raisonnement très courant, que nous allons maintenant décrire : le raisonnement par analyse-synthèse.

2 – Principe de preuve par analyse-synthèse

Afin de déterminer les solutions d’un certain problème, on procède de la manière suivante …

Dans un premier temps, on cherche des conditions nécessairement vérifiées par une éventuelle solution.

Si ces conditions sont suffisamment contraignantes, on débouche sur un ensemble assez petit (peut-être fini) de solutions possibles (ou “candidates”) … Cette première partie est appelée “l’analyse” ou “la recherche d’une condition nécessaire”.

Mais attention, rien ne dit à ce stade que ces solutions possibles sont des solutions effectives ! Il se pourrait même que le problème en question ne possède aucune solution.

Pour le savoir, on doit examiner les solutions candidates et déterminer, pour chacune d’elles, s’il s’agit d’une solution effective ou bien si elle doit être écartée. Cette seconde partie est appelée “la synthèse” ou “la recherche d’une condition suffisante”.

Remarque

Si les termes “condition nécessaire” et “condition suffisante” vous paraissent confus, le remède est simple ! Allez donc jeter un coup d’œil à cet article de vulgarisation.

Pour caricaturer le raisonnement par analyse-synthèse, il m’arrive de raconter l’exemple (farfelu) suivant à mes étudiants : imaginez qu’on vous demande de prouver l’existence, dans votre appartement, d’une canette de bière bien fraîche !

Une approche pas très futée consisterait à visiter systématiquement tout l’appartement : l’entrée, le séjour, les chambres à coucher, la salle de bain, etc … jusqu’à ce que vous mettiez la main sur cette fameuse canette.

Il semble judicieux de procéder autrement : si votre appartement abrite effectivement une canette de bière bien fraîche, alors celle-ci doit nécessairement se trouver au réfrigérateur (analyse).

Maintenant, il suffit de filer tout droit dans la cuisine, d’ouvrir la porte du frigo et … de trouver la canette qui nous y attend bien sagement (synthèse).

Nous allons appliquer ce mode de raisonnement au problème particulier qui nous intéresse, à savoir : établir une égalité du type E=F\oplus G.

Analyse

Donnons-nous un vecteur z\in E et supposons qu’il existe des vecteurs x\in F et y\in G tels que z=x+y.

En profitant du contexte (voir exemples à la section 3 ci-dessous), il est possible de montrer que x et y sont déterminés de façon unique en fonction de z.

Synthèse

Si x et y sont définis par les formules obtenues à la fin de la partie “analyse”, on doit vérifier que :

  • x\in F
  • y\in G
  • x+y=z

Voyons en détail quelques exemples afin d’illustrer cela.

3 – Six exemples détaillés

Exemple 1

Considérons les vecteurs de \mathbb{R}^2 suivants :

    \[v=(2,1)\qquad\text{et}\qquad w=(1,-3)\]

et montrons que les droites vectorielles \mathbb{R}v et \mathbb{R}w sont supplémentaires dans \mathbb{R}^2, c’est-à-dire que :

    \[\mathbb{R}^2=\mathbb{R}v\oplus\mathbb{R}w\]

Détail des calculs (cliquer pour déplier / replier)

Raisonnons par analyse-synthèse.

Soit (x,y)\in\mathbb{R}^2. Supposons qu’il existe a\in\mathbb{R} et b\in\mathbb{R} tels que :

    \[(x,y)=(2a,a)+(b,-3b)\]

c’est-à-dire :

    \[\left\{\begin{matrix}x & = & 2a+b\\y & = & a-3b\end{matrix}\right.\]

Alors :

    \[\left\{\begin{matrix}a & = & \displaystyle{\frac{3x+y}{7}}\\\\b & = & \displaystyle{\frac{x-2y}{7}}\end{matrix}\right.\]

Réciproquement, si a et b sont ainsi définis, on vérifie facilement que :

    \begin{eqnarray*}(x,y) & = & (2a,a)+(b,-3b)\\(2a,a) & \in & \mathbb{R}(2,1)\\(b,-3b) & \in & \mathbb{R}(1-3)\\\end{eqnarray*}

Finalement :

    \[\mathbb{R}^2=\mathbb{R}(2,1)\oplus\mathbb{R}(1,-3)\]

Plus généralement, si v et w sont deux vecteurs non colinéaires d’un \mathbb{K}-espace vectoriel E de dimension 2, alors :

    \[E=\mathbb{K}v\oplus\mathbb{K}w$\]

Encore plus généralement, si (e_1,\ldots,e_n) est une famille libre de vecteurs d’un \mathbb{K}-espace vectoriel E de dimension n, alors :

    \[E=\bigoplus_{i=1}^n\mathbb{K}e_i\]

Exemple 2

Soient v=(2,1,-1)\in\mathbb{R}^3 et H=\{(x,y,z)\in\mathbb{R}^3;\,x+2y-z=0\}. Alors :

    \[\mathbb{R}^3=\mathbb{R}v\oplus H\]

Détail des calculs (cliquer pour déplier / replier)

Raisonnons par analyse-synthèse.

Soit (x,y,z)\in\mathbb{R}^3. Supposons qu’il existe \lambda\in\mathbb{R} et (a,b,c)\in H tels que :

    \[(x,y,z)=(2\lambda,\lambda,-\lambda)+(a,b,c)\]

c’est-à-dire (vu que c=a+2b) :

    \[(x,y,z)=(2\lambda,\lambda,-\lambda)+(a,b,a+2b)\]

ou encore :

    \[\left\{\begin{matrix}x & = & 2\lambda+a & \qquad(1)\\y & = & \lambda+b & \qquad(2)\\z & = & -\lambda+a+2b & \qquad(3)\end{matrix}\right.\]

Alors, en effectuant la combinaison (1)+2(2)-(3) :

    \[\lambda=\boxed{\frac{x+2y-z}{5}}\]

d’où en reportant dans (1) :

    \[a=x-2\lambda=x-\frac{2x+4y-2z}{5}=\boxed{\frac{3x-4y+2z}{5}}\]

puis en reportant dans (2) :

    \[b=y-\lambda=y-\frac{x+2y-z}{5}=\boxed{\frac{-x+3y+z}{5}}\]

Réciproquement, si \lambda, a et b sont respectivement définis par les formules encadrées, alors :

    \[\left\{\begin{matrix}X=(2\lambda,\lambda,-\lambda) & \in & \mathbb{R}(2,1,-1)\\\\Y=\displaystyle{(\frac{3x-4y+2z}{5},\frac{-x+3y+z}{5},\frac{x+2y+4z}{5})} & \in & H\\\\X+Y & = & (x,y,z)\end{matrix}\right.\]

Finalement :

    \[\mathbb{R}^3=\mathbb{R}v\oplus H\]

Plus généralement, si H est un hyperplan de E (c’est-à-dire, lorsque E est de dimension n, un sous-espace de dimension n-1 et, en toute généralité, le noyau d’une forme linéaire non nulle) et si v\in E-H, alors E=\mathbb{K}v\oplus H.

Preuve (cliquer pour déplier / replier)

Soit E un \mathbb{K}-espace vectoriel et soit \phi une forme linéaire sur E (c’est-à-dire une application linéaire de E dans \mathbb{K}).

Supposons \phi non nulle et notons H son noyau (qui est donc strictement contenu dans E).

Soit encore a\in E-H; montrons que

    \[E=H\oplus\mathbb{K}a\]

Pour cela, raisonnons, encore et toujours, par analyse-synthèse.

Etant donné x\in E, supposons qu’il existe h\in H et \lambda\in \mathbb{K} tels que :

    \[x=h+\lambda a\]

On appliquant \phi, on voit que :

    \[\phi(x)=\phi(h)+\lambda\phi(a)=\lambda\phi(a)\]

et comme \phi(a)\neq 0, il s’ensuit que :

    \[\lambda=\frac{\phi(x)}{\phi(a)}\]

d’où, par différence :

    \[h=x-\frac{\phi(x)}{\phi(a)} a\]

Réciproquement, si h et \lambda sont ainsi définis, alors d’évidence h+\lambda a=x et de plus :

    \begin{eqnarray*}\phi(h) & = & \phi\left(x-\frac{\phi(x)}{\phi(a)} a\right)\\& = & \phi(x)-\frac{\phi(x)}{\phi(a)} \phi(a)\\& = & 0\end{eqnarray*}

ce qui prouve que h\in H.

Exemple 3

Notons E le \mathbb{R}-espace vectoriel des applications de \mathbb{R} dans \mathbb{R} et considérons les deux sous-ensembles suivants :

\mathcal{P} désigne l’ensemble des applications f\in E qui sont paires, c’est-à-dire telles que :

    \[\boxed{\begin{matrix}\quad & \quad & \quad\\\quad & \forall x\in\mathbb{R},\,f(-x)=f(x) & \quad\\\quad & \quad & \quad\end{matrix}}\]

\mathcal{I} désigne l’ensemble des applications f\in E qui sont impaires, c’est-à-dire telles que :

    \[\boxed{\begin{matrix}\quad & \quad & \quad\\\quad & \forall x\in\mathbb{R},\,f(-x)=-f(x) & \quad\\\quad & \quad & \quad\end{matrix}}\]

Avec ces notations, \mathcal{P} et \mathcal{I} sont des sous-espaces vectoriels de E et de plus :

    \[E=\mathcal{P}\oplus\mathcal{I}\]

Détail des calculs (cliquer pour déplier / replier)

Raisonnons par analyse-synthèse.

Soit f\in E. Supposons qu’il existe p\in\mathcal{P} et i\in\mathcal{I} telles que f=p+i.

Alors, pour tout x\in\mathbb{R} :

    \[\left\{\begin{matrix}f(x) & = & p(x)+i(x)\\f(-x) & = & p(-x)+i(-x)\end{matrix}\right.\]

c’est-à-dire :

    \[\left\{\begin{matrix}f(x) & = & p(x)+i(x)\\f(-x) & = & p(x)-i(x)\end{matrix}\right.\]

ce qui impose :

    \[\boxed{p(x)=\frac{f(x)+f(-x)}{2}}\qquad\text{et}\qquad\boxed{i(x)=\frac{f(x)-f(-x)}{2}}\]

Réciproquement, si p et i sont ainsi définies, alors on voit immédiatement que p est paire, que i est impaire et que p+i=f.

En conclusion, toute application f:\mathbb{R}\to\mathbb{R} peut s’écrire, de manière unique, comme la somme d’une application paire et d’une application impaire. Autrement dit :

    \[E=\mathcal{P}\oplus\mathcal{I}\]

En particulier, la fonction exponentielle se décompose en ses parties paire et impaire, respectivement définies par :

    \[x\mapsto\frac{e^x+e^{-x}}{2}\qquad\text{et}\qquad x\mapsto\frac{e^x-e^{-x}}{2}\]

La première de ces deux fonctions est appelée “cosinus hyperbolique” et la seconde “sinus hyperbolique”. Elles sont traditionnellement notée cosh et sinh (notation internationale … en France, on est habitué aux notations ch et sh).

Sans entamer une trop longue digression à ce sujet, on peut préciser que le qualificatif d’hyperbolique provient du fait que les deux branches de l’hyperbole d’équation x^2-y^2=1 admettent les représentations paramétriques suivantes :

    \[\left\{\begin{matrix}x & = & -\text{ch}(t)\\y & = & \text{sh}(t)\end{matrix}\right.\qquad\text{pour la branche de gauche}\]

et

    \[\left\{\begin{matrix}x & = & \text{ch}(t)\\y & = & \text{sh}(t)\end{matrix}\right.\qquad\text{pour la branche de droite}\]

Ceci est à rapprocher du fait que le cercle unité admet la célèbre représentation paramétrique :

    \[\left\{\begin{matrix}x & = & \cos(t)\\y & = & \sin(t)\end{matrix}\right.\]

ce qui explique la terminologie de trigonométrie circulaire.

Exemple 4

Soit E un \mathbb{K}-espace vectoriel et soit p un endomorphisme de E tel que p\circ p=p.

Alors :

    \[E=\ker(p)\oplus\ker(p-id_E)\]

Détail des calculs (cliquer pour déplier / replier)

Raisonnons par analyse-synthèse.

Soit x\in E. Supposons qu’il existe a\in\ker(p) et b\in\ker(p-id_E) tels que :

    \[a+b=x\]

En appliquant p à chaque membre de cette égalité, il vient :

    \[p(a)+p(b)=p(x)\]

Or p(a)=0_E et p(b)=b et par conséquent :

    \[\boxed{b=p(x)}\]

d’où par différence :

    \[\boxed{a=x-p(x)}\]

Réciproquement, si les vecteurs a et b sont ainsi définis, alors :

    \[p(a)=p(x-p(x))=p(x)-p^2(x)=0_E\]

ce qui prouve que a\in\ker(p), et :

    \[(p-id_E)(b)=p(b)-b=p^2(x)-p(x)=0_E\]

ce qui prouve que b\ker(p-id_E).

On a bien prouvé que :

    \[E=\ker(p)\oplus\ker(p-id_E)\]

Cet exemple est fondamental. Les endomorphismes p vérifiant p\circ p=p (ce qu’on peut aussi noter p^2=p) sont appelés projecteurs et jouent un rôle central en algèbre linéaire et en géométrie.

Précisons que si p est un projecteur, son sous-espace invariant \ker(p-id_E) est confondu avec son image. Sauriez-vous établir cela ? Réponse en annexe.

Aux projecteurs sont associés d’autres endomorphismes d’usage fréquent : les symétries. Ce sont les s\in\mathcal{L}(E) vérifiant s^2=id_E. Sauriez-vous prouver que si s vérifie cette condition, alors E=\ker(s-id_E)\oplus\ker(s+id_E) ? Réponse en annexe également …

Exemple 5

Soit E un \mathbb{R}-espace vectoriel et soit f\in\mathcal{L}(E) un endomorphisme tel que f^3+f=0.

Alors :

    \[E=\ker(f)\oplus\ker(f^2+id_E)\]

Détail des calculs (cliquer pour déplier / replier)

Soit x\in E. Supposons qu’il existe a\in\ker(f) et b\in\ker(f^2+id_E) tels que :

    \[a+b=x\]

et appliquons f^2 aux deux membres de cette égalité. Il vient :

    \[f^2(a)+f^2(b)=f^2(x)\]

Or d’une part f(a)=0_E, d’où f^2(a)=0_E et d’autre part f^2(b)=-b; par conséquent :

    \[\boxed{b=-f^2(x)}\]

et par différence :

    \[\boxed{a=f^2(x)+x}\]

Réciproquement, si a et b sont ainsi définis, alors on constate que :

  • f(a)=f^3(x)+f(x)=0_E
  • (f^2+id_E)(b)=-f^4(x)-f^2(x)=-f\left(f^3(x)+f(x)\right)=0_E

ce qui montre déjà que a\in\ker(f) et b\in\ker(f^2+id). En outre, il est clair que a+b=x. Ceci termine la preuve.

Cet exemple et le précédent sont deux cas particuliers d’un résultat général, connu sous le nom de lemme de décomposition des noyaux. Pour en savoir plus à ce sujet, on pourra consulter cette vidéo.

Exemple 6

Considérons l’espace E des applications de classe \mathcal{C}^1 de [0,1] dans \mathbb{R} ainsi qu’un entier n\geqslant 1.

Notons alors :

    \[F=\text{vect}\{e_1,\ldots,e_n\}\]

avec, pour tout k\in\{1,\ldots,n\} :

    \[e_k:[0,1]\to\mathbb{R},\,t\mapsto t^k\]

ainsi que :

    \[G=\{u\in E;\,\forall k\in\{1,\ldots,n\},\,\int_0^1t^k\,u'(t)\,dt=0\}\]

Alors : E=F\oplus G.

Preuve (cliquer pour déplier / replier)

Il se trouve que F est (d’évidence) un sous-espace de dimension finie de E et que G n’est autre que son orthogonal relativement au produit scalaire défini par :

    \[\forall(f,g)\in E^2,\,\left(f\mid g\right)=f(0)\,g(0)+\int_0^1f'(t)g'(t)\,dt\]

La conclusion est alors conséquence d’un résultat général, à savoir que si F est un sous-espace de dimension finie d’un espace préhilbertien réel E, alors E=F\oplus F^\perp. Pour aller plus loin sur ce terrain, on pourra consulter cet article.

4 – L’astuce de la dimension finie

Soient, à nouveau, un \mathbb{K}-espace vectoriel E et deux sous-espaces F et G de E.

Si E est de dimension finie et si l’on veut prouver que E=F\oplus G, alors il suffit de vérifier que :

(1) \qquad\dim(F)+\dim(G)=\dim(E)
(2a) \qquad F\cap G=\{0_E\}

ou bien de vérifier que :

(1) \qquad\dim(F)+\dim(G)=\dim(E)
(2b) \qquad E\subset F+G

En effet, sous les hypothèses (1) et (2a) :

    \[\dim(F\oplus G)=\dim(F)+\dim(G)=\dim(E)\]

ce qui prouve que E=F\oplus G.

Et sous les hypothèses (1) et (2b), on voit déjà (avec (2b)) que E=F+G, puis d’après la formule de Grassmann :

    \[\dim(F\cap G)=\dim(F)+\dim(G)-\dim(F+G)=0\]

ce qui prouve que F\cap G=\{0_E\} et donc que E=F\oplus G.

Pour l’essentiel, cette méthode nous épargne le calcul explicite de la décomposition d’un vecteur quelconque de E en la somme d’un vecteur de F et d’un vecteur de G.

Ceci est un avantage dans la mesure où la dose de calcul est allégée … mais cela peut constituer un inconvénient si l’on a besoin de connaître explicitement cette fameuse décomposition (par exemple, pour déterminer l’expression analytique d’un projecteur une d’une symétrie).

Donnons un exemple d’utilisation de cette idée…

Exemple

Considérons un \mathbb{K}-espace vectoriel de dimension finie n et un endomorphisme f de E.

On suppose qu’il existe g\in\mathcal{L}(E) tel que :

  • (1) \qquad\qquad f\circ g=0
  • (2) \qquad\qquad f+g\in\text{GL}(E)

Montrons que, sous ces hypothèses :

    \[E=\text{Im}(f)\oplus\ker(f)\]

Preuve (cliquer pour déplier / replier)

L’hypothèse (1) se traduit par l’inclusion \text{Im}(g)\subset\ker(f).

Il est par ailleurs évident que \text{Im}(f+g)\subset\text{Im}(f)+\text{Im}(g).

Donc, d’après (2) :

    \begin{eqnarray*}E & = & \text{Im}(f+g)\\& \subset & \text{Im}(f)+\text{Im}(g)\\& \subset & \text{Im}(f)+\ker(f)\end{eqnarray*}

ce qui impose : E=\text{Im}(f)+\ker(f)

En outre, d’après la formule de Grassmann :

    \[\dim(\text{Im}(f)\cap\ker(f))=\text{rg}(f)+\dim(\ker(f))-\dim(\text{Im}(f)+\ker(f))\]

et donc, en appliquant à f la formule du rang :

    \[\dim(\text{Im}(f)\cap\ker(f))=0\]

ce qui signifie que :

    \[\text{Im}(f)\cap\ker(f)=\{0_E\}\]

et la conclusion suit.

Remarque 1

Les conditions (1) et (2) ci-dessus sont remplies dans le cas où f est un projecteur. En effet, si l’on pose g=id_E-f, alors :

  • d’une part f\circ g=f-f^2=0
  • d’autre part f+g=id_E\in\text{GL}(E)

Ceci permet de retrouver l’égalité E=\text{Im}(f)\oplus\ker(f) qui est bien connue dans ce cas (voir l’exemple 4 ci-dessus).

Remarque 2

Les conditions (1) et (2) entraînent que l’image et le noyau de f sont supplémentaires. Cette implication est en fait une équivalence.

En effet, introduisons le projecteur g sur \ker(f) et parallèlement à \text{Im}(f).

  • D’une part, pour tout x\in E, on a (f\circ g)(x)=0_E puisque g(x)\in\ker(f). Ainsi : f\circ g=0.
  • D’autre part, si x\in\ker(f+g), alors f(x)=g(-x), ce qui montre que f(x)\in\text{Im}(f)\cap\text{Im}(g)=\text{Im}(f)\cap\ker(f) et donc f(x)=0_E. Mais alors x\in\ker(f)\cap\ker(g)=\ker(f)\cap\text{Im}(f) et donc x=0_E. Ceci prouve que f+g est un endomorphisme injectif et donc un automorphisme de E.

5 – Quelques mots au sujet de E_1\oplus\cdots\oplus E_n

Bien que ce ne soit pas le thème principal de cet article, on ne pouvait pas laisser sous silence la généralisation naturelle de ce qui précède au cas de plusieurs sous-espaces.

Voici donc, à nouveau, les définitions 1 et 2 données au tout début, mais sous une forme élargie :

Définition

Etant donnés un entier n\geqslant2 et des sous-espaces vectoriels E_1,\ldots,E_n de E, on note :

    \[\sum_{i=1}^nE_i=\left\{\sum_{i=1}^nx_i;\,\forall i\in\{1,\ldots,n\},\,x_i\in E_i\right\}\]

En bon français, cela signifie simplement que \displaystyle{\sum_{i=1}^nE_i} est l’ensemble des vecteurs pouvant s’écrire comme la somme d’un vecteur de E_1, d’un vecteur de E_2, etc …, d’un vecteur de E_n.

Cette somme S=\displaystyle{\sum_{i=1}^nE_i} est dite directe lorsque tout vecteur de S peut s’écrire d’une seule manière sous cette forme. On note alors \displaystyle{\bigoplus_{i=1}^nE_i} au lieu de \displaystyle{\sum_{i=1}^nE_i}.

Nous avons vu plus haut une proposition caractérisant les sommes directes de deux sous-espaces. Voici comment on peut la généraliser :

Proposition

Soient E_1,\ldots,E_n des sous-espaces vectoriels de E.

Les assertions suivantes sont équivalentes :

  1. La somme \displaystyle{\sum_{i=1}^nE_i} est directe
  2. Quels que soient les vecteurs x_1\inE_1x_n\in E_n :

        \[\sum_{i=1}^nx_i=0_E\Rightarrow\forall i\in\{1,\ldots,n\},\,x_i=0_E\]

Une erreur classique consiste à affirmer que la somme des E_i serait directe si, et seulement si, \displaystyle{\bigcap_{i=1}^nE_i=\{0_E\}}. C’est correct pour n=2, mais c’est faux dès que n\geqslant 3.

Par exemple, l’intersection de trois droites vectorielles distinctes de \mathbb{R}^2 est réduite à \{(0,0)\} mais la somme de ces trois droites n’est évidemment pas directe (sans quoi sa dimension serait égale à 3, ce qui est un peu trop pour un sous-espace de \mathbb{R}^2).

Donnons un exemple à la fois simple et significatif de somme directe de plusieurs sous-espaces.

Exemple : somme directe de sev propres

Soit E un \mathbb{K}-espace vectoriel et soit u\in\mathcal{L}(E).

Supposons que \lambda_1,\ldots,\lambda_r (avec r\in\mathbb{N}^\star) soient des valeurs propres de u, deux à deux distinctes.

Notons, pour tout i\in\{1,\ldots,r\} :

    \[E_i=\ker(u-\lambda_i \,id_E)\]

Alors la somme \displaystyle{\sum_{i=1}^rE_i} est directe.

Preuve (cliquer pour déplier / replier)

On procède par récurrence sur le nombre de valeurs propres.

Pour r=1, il n’y a rien à démontrer.

Supposons la propriété établie pour un certain r\in\mathbb{N}^\star et soient alors \lambda_1,\ldots,\lambda_{r+1} des valeurs propres deux à deux distinctes de u.

Pour montrer que la somme \displaystyle{\sum_{i=1}^{r+1}E_i} est directe, utilisons la caractérisation donnée dans la proposition précédente.

Soient x_1\in E_1, …, x_{r+1}\in E_{r+1} tels que :

    \[\sum_{i=1}^{r+1}x_i=0_E\qquad\left(\spadesuit}\right)\]

Appliquons u :

    \[\sum_{i=1}^{r+1}\lambda_i\,x_i=0_E\qquad\left(\clubsuit\right)\]

Retranchons à (\clubsuit) l’égalité (\spadesuit) préalablement multipliée par \lambda_{r+1} :

    \[\sum_{i=1}^r\left(\lambda_i-\lambda_{r+1}\right)x_i=0_E\]

L’hypothèse de récurrence permet d’affirmer que :

    \[\forall i\in\{1,\ldots,r\},\,\left(\lambda_i-\lambda_{r+1}\right)x_i=0_E\]

et donc, vu que \lambda_1,\ldots,\lambda_r sont tous différents de \lambda_{r+1}, on voit que :

    \[\forall i\in\{1,\ldots,r\},\,x_i=0_E\]

et en reportant ceci dans (\spadesuit), il s’ensuit que x_{r+1}=0_E.

Attention, cette somme directe n’a aucune raison d’être égale à E tout entier !

Cependant, le cas où \displaystyle{E=\bigoplus_{i=1}^rE_i} est important, car il existe alors une base de E (obtenue en concaténant des bases de chacun des E_i) dans laquelle u est représenté par une matrice diagonale. On dit, dans ce cas, que l’endomorphisme u est diagonalisable.

Annexe

Dans cette section, on détaille les réponses aux questions laissées en suspens plus haut.

Proposition annexe 1

Si F et G sont deux sous-espaces vectoriels de E, alors :

    \[F+G=\text{vect}\left(F\cup G\right)\]

Preuve (cliquer pour déplier / replier)

Rappelons au préalable que si A\subset E, on désigne par \text{vect}(A) l’ensemble des combinaisons linéaires de vecteurs de A. Il s’agit d’un sous-espace de E, qui est aussi l’intersection de la famille des sous-espaces contenant A.
En outre, tout sous-espace de E contenant A contient nécessairement \text{vect}(A).

Cela dit …

Il est clair que F\subset F+G et que G\subset F+G. Ainsi F\cup G\subset F+G et comme F+G est un sev de E, alors \text{vect}\left(F\cup G\right)\subset F+G.

Par ailleurs, si x\in F+G, alors il existe y\in F et z\in G tels que x=y+z=1y+1z, ce qui montre que x\in\text{vect}\left(F\cup G\right).

Proposition annexe 2

Si p est un projecteur, alors son sous-espace invariant coïncide avec son image.

Preuve (cliquer pour déplier / replier)

Si x\in\ker(p-id_E), alors x=p(x), et donc x\in\text{Im}(p). Ceci prouve que \ker(p-id_E)\subset\text{Im(p)}. Noter que cette inclusion reste valable pour n’importe quel endomorphisme !

Réciproquement, si x\in\text{Im}(p), alors il existe a\in E tel que x=p(a), d’où (p-id_E)(x)=p(x)-x=p^2(a)-p(a)=0_E. Et ceci prouve l’inclusion inverse.

Proposition annexe 3

Soit s\in\mathcal{L}(E) vérifiant s^2=id_E. Alors :

    \[E=\ker(s-id_E)\oplus\ker(s+id_E)\]

Preuve 1 (cliquer pour déplier / replier)

Soit x\in E. Supposons qu’il existe a\in\ker(s-id_E) et b\in\ker(s+id_E) tels que x=a+b. En appliquant s, on obtient s(x)=a-b puis, par somme et différence :

    \[\left\{\begin{matrix}a & = & \frac12\left(x+s(x)\right)\\\\b & = & \frac12\left(x-s(x)\right) \end{matrix}\right.\]

Réciproquement, si a et b sont ainsi définis, alors il est immédiat que a+b=x.

En outre :

  • (s-id_E)(a)=\frac12\left(s-id_E\right)\circ\left(s+id_E\right)(x)=\frac12\left(s^2(x)-x\right)=0_E
  • (s+id_E)(b)=\frac12\left(id_E+s\right)\circ\left(id_E-s\right)(x)=\frac12\left(x-s^2(x)\right)=0_E

donc a\in\ker(s-id_E) et b\in\ker(s+id_E).

Preuve 2 (cliquer pour déplier / replier)

Posons :

    \[p=\frac12\left(id_E+s\right)\]

Alors :

    \[p^2=\frac14\left(id_E+2s+s^2\right)=\frac12\left(2\,id_E+2s\right)=p\]

Autrement dit, p est un projecteur et nous savons que :

    \[E=\ker(p-id_E)\oplus\ker(p)\]

Or, il est facile de voir que :

    \[\ker(p-id_E)=\ker(s-id_E)\qquad\text{et}\qquad\ker(p)=\ker(s+id_E)\]

d’où le résultat annoncé.


J’espère avoir contribué, par cet article, à vous rendre les choses plus claires 🙂

Vos questions ou remarques seront toujours les bienvenues. Vous pouvez laisser un commentaire ci-dessous ou bien passer par le formulaire de contact.

Partager cet article
  •  
  •  
  •  
  •  

Laisser un commentaire