Lettre J

JENSEN (inégalité de)

Soit I un intervalle non trivial et soit f:I\rightarrow\mathbb{R} une application convexe. Alors :

Théorème

Soit un entier n\geqslant2, ainsi que \left(x_{1},\cdots,x_{n}\right)\in I^{n} et \left(t_{1},\cdots,t_{n}\right)\in\left[0,1\right]^{n} tel que {\displaystyle \sum_{k=1}^{n}t_{k}=1}. Alors :

    \[f\left(\sum_{k=1}^{n}t_{k}x_{k}\right)\leqslant\sum_{k=1}^{n}t_{k}\thinspace f\left(t_{k}\right)\]

Cette inégalité est attribuée au mathématicien danois Johan Jensen (1859 – 1925).

La preuve se fait par récurrence. Pour n=2, c’est la définition de la convexité. En supposant le résultat établi au rang n, pour un certain n\geqslant2, on se donne x_{1},\cdots,x_{n+1}\in I et t_{1},\cdots,t_{n+1}\geqslant0 tels que {\displaystyle \sum_{k=1}^{n+1}t_{k}=1.} Si t_{n+1}=1, alors t_{k}=0 pour tout k\in\left\llbracket 1,n\right\rrbracket et il n’y a rien à démontrer. Et si t_{n+1}\neq1, alors en posant {\displaystyle T=\sum_{k=1}^{n}t_{k}}, on voit que T\neq0 et que :

    \[\sum_{k=1}^{n+1}t_{k}x_{k}=T\sum_{k=1}^{n}\dfrac{t_{k}}{T}\thinspace x_{k}+\left(1-T\right)x_{n+1}\]

d’où, par convexité de f :

    \[f\left(\sum_{k=1}^{n+1}t_{k}x_{k}\right)\leqslant T\thinspace f\left(\sum_{k=1}^{n}\dfrac{t_{k}}{T}\thinspace x_{k}\right)+\left(1-T\right)\thinspace f\left(x_{n+1}\right)\]

puis, d’après l’hypothèse de récurrence :

    \begin{eqnarray*}f\left(\sum_{k=1}^{n+1}t_{k}x_{k}\right) & \leqslant & T\thinspace\sum_{k=1}^{n}\dfrac{t_{k}}{T}\thinspace f\left(x_{k}\right)+\left(1-T\right)\thinspace f\left(x_{n+1}\right)\\& = & \sum_{k=1}^{n}t_{k}\thinspace f\left(x_{k}\right)+t_{n+1}\thinspace f\left(x_{n+1}\right)\\& = & \sum_{k=1}^{n+1}t_{k}\thinspace f\left(x_{k}\right)\end{eqnarray*}

comme souhaité.

On appelle aussi inégalité de Jensen la version continue de ce qui précède :

Théorème

Soit u:\left[a,b\right]\rightarrow\mathbb{R} une application continue. On suppose que I est un intervalle non trivial, que u\left\langle \left[a,b\right]\right\rangle \subset I et que f:I\rightarrow\mathbb{R} est convexe. Alors :

    \[f\left(\dfrac{1}{b-a}\int_{a}^{b}u\left(t\right)\thinspace dt\right)\leqslant\dfrac{1}{b-a}\int_{a}^{b}f\circ u\left(t\right)\thinspace dt\]

Exercice pour le lecteur : déduire cette inégalité de la version discrète énoncée plus haut, en utilisant le théorème de convergence des sommes de Riemann.

JORDAN (matrice de)

Etant donné un entier n\geqslant1, on appelle matrice (ou cellule) de Jordan de taille n la matrice J_{n}=\left[\delta_{i+1,j}\right]_{1\leqslant i,j\leqslant n}, considérée comme élément de l’algèbre \mathcal{M}_{n}\left(\mathbb{K}\right).

Les termes de cette matrice sont donc tous nuls, à l’exception de ceux situés sur la « sur-diagonale », qui valent 1. Ci-dessous les matrices J_{2} et J_{5} :

    \[J_{2}=\left[\begin{array}{cc}0 & 1\\0 & 0\end{array}\right]\qquad J_{5}=\left[\begin{array}{ccccc}0 & 1 & 0 & 0 & 0\\0 & 0 & 1 & 0 & 0\\0 & 0 & 0 & 1 & 0\\0 & 0 & 0 & 0 & 1\\0 & 0 & 0 & 0 & 0\end{array}\right]\]

L’endomorphisme f\in\mathcal{L}\left(\mathbb{K}^{n}\right), canoniquement associé à J_{n}, est défini par :

    \[f\left(e_{1}\right)=0\qquad\text{et}\qquad\forall j\in\left\llbracket 2,n\right\rrbracket ,\thinspace f\left(e_{j}\right)=e_{j-1}\]

\left(e_{1},\cdots,e_{n}\right) désigne la base canonique de \mathbb{K}^{n}. Il est facile de voir que si E est un \mathbb{K}-espace vectoriel de dimension n\geqslant2 et si f\in\mathcal{L}\left(E\right) est nilpotent d’indice n (ce qui signifie que f^{n}=0 et f^{n-1}\neq0), alors il existe une base de E dans laquelle f est représenté par J_{n}. Ceci se généralise :

Théorème (réduction de Jordan – cas nilpotent)

Si E est un \mathbb{K}-espace vectoriel de dimension n\geqslant2 et si f\in\mathcal{L}\left(E\right) est nilpotent, alors il existe une base de E dans laquelle f est représenté par une matrice diagonale par blocs, chaque bloc étant une matrice de Jordan.

Une conséquence est l’important théorème suivant :

Théorème (réduction de Jordan – cas général)

Soit E est un \mathbb{K}-espace vectoriel de dimension n\geqslant2 et soit f\in\mathcal{L}\left(E\right) dont le polynôme caractéristique est scindé. Alors il existe une base de E dans laquelle f est représenté par une matrice diagonale par blocs, chaque bloc étant de la forme \lambda I_{k}+J_{k},\lambda est une valeur propre de f.

Le second théorème se démontre à partir du premier de la manière suivante. On note \chi le polynôme caractéristique de f. Comme \chi est scindé dans \mathbb{K}\left[X\right], il en va de même du polynôme minimal de f, noté \mu_{f}. On peut donc écrire :

    \[\mu_{f}=\prod_{i=1}^{p}\left(X-\lambda_{i}\right)^{r_{i}}\]

\lambda_{1},\cdots,\lambda_{p}\in\mathbb{K} sont les valeurs propres distinctes de f.
Le lemme de décomposition des noyaux donne
{\displaystyle E=\bigoplus_{i=1}^{p}N_{i},} où les N_{i} sont les sous-espaces caractéristiques de f :

    \[\forall i\in\left\llbracket 1,p\right\rrbracket ,\thinspace N_{i}=\ker\left[\left(f-\lambda_{i}\thinspace id_{E}\right)^{r_{i}}\right]\]

On peut montrer que, pour tout i\in\left\llbracket 1,p\right\rrbracket :

  • la restriction de f-\lambda_{i}\thinspace id_{E} à N_{i} est nilpotente d’indice r_{i},
  • la dimension de N_{i} est égale à la multiplicité m_{i} de \lambda_{i} en tant que racine de \chi.

Il existe donc, d’après le premier théorème, une base de N_{i} dans laquelle la restriction de f est représentée par une matrice diagonale par blocs, chaque bloc étant de la forme \lambda_{i}I_{k}+J_{k}. Il ne reste plus qu’à concaténer ces bases, ce qui fournit une base de E dans laquelle la matrice de f possède la forme voulue.

Partager cet article