Exercices

Exercice 1   Écrire (sans utiliser de boucle) les vecteurs suivants :
  1. Nombres de $ 1$ à $ 3$ par pas de $ 0.1$.
  2. Nombres de $ 3$ à $ 1$ par pas de $ -0.1$.
  3. Carrés des $ 10$ premiers entiers.
  4. Nombres de la forme $ (-1)^n n^2$ pour $ n=1,\ldots,10$.
  5. $ 10$ ``0'' suivis de $ 10$ ``$ 1$''.
  6. $ 3$ ``0'' suivis de $ 3$ ``$ 1$'', suivis de $ 3$ ``$ 2$'',..., suivis de $ 3$ ``$ 9$''.
  7. ``$ 1$'', suivi de $ 1$ ``0'', suivi de ``2'', suivi de 2 ``0'',... , suivi de ``$ 8$'', suivi de $ 8$ zéros, suivi de ``$ 9$''.
  8. $ 1$ ``$ 1$'' suivi de $ 2$ ``$ 2$'', suivis de $ 3$ ``$ 3$'',..., suivis de $ 9$ ``$ 9$''.

Exercice 2   Écrire (sans utiliser de boucle) les matrices carrées d'ordre $ 6$ suivantes :
  1. Matrice diagonale, dont la diagonale contient les entiers de $ 1$ à $ 6$.
  2. Matrice contenant les entiers de $ 1$ à $ 36$, rangés par lignes.
  3. Matrice dont toutes les lignes sont égales au vecteur des entiers de $ 1$ à $ 6$.
  4. Matrice diagonale par blocs, contenant un bloc d'ordre $ 2$ et un d'ordre $ 4$. Les $ 4$ coefficients du premier bloc sont égaux à $ 2$. Le deuxième bloc contient les entiers de $ 1$ à $ 16$ rangés sur $ 4$ colonnes.
  5. Matrice $ A=((-1)^{i+j}) , i,j=1,\ldots,6$.
  6. Matrice contenant des ``$ 1$'' sur la diagonale, des ``$ 2$'' au-dessus et au-dessous, puis des ``$ 3$'', jusqu'aux coefficients d'ordre $ (1,6)$ et $ (6,1)$ qui valent $ 6$.

Exercice 3   Écrire la matrice $ A=(a_{i,j})$ d'ordre $ 12$ contenant les entiers de $ 1$ à $ 144$, rangés par lignes. Extraire de cette matrice les matrices $ B$ suivantes.
  1. Coefficients $ a_{i,j}$ pour $ i=1,\ldots,6$ et $ j=7,\ldots,12$.
  2. Coefficients $ a_{i,j}$ pour $ i+j$ pair.
  3. Coefficients $ a_{i,j}$ pour $ i,j=1,2,5,6,9,10$.

Exercice 4   Pour $ (n=100, p=0.5)$, puis $ (n=1000, p=0.5)$, $ (n=10000, p=0.5)$, $ (n=1000, p=0.3)$, $ (n=1000, p=0.8)$ :
  1. Simuler un échantillon de $ n$ variables aléatoires de Bernoulli, de paramètre $ p$,
    1. en utilisant la fonction rbinom
    2. en utilisant la fonction runif
    3. en utilisant la fonction sample
  2. Calculer les fréquences de 0 et de $ 1$ dans l'échantillon,
    1. en utilisant la fonction sum
    2. en utilisant la fonction which
    3. en utilisant la fonction table
  3. Représenter les fréquences de 0 et de 1 par un diagramme en barres (fonction barplot). Représenter par un double diagramme en barre, les fréquences empiriques de 0 et de 1 en bleu et les probabilités théoriques $ (1-p)$ et $ p$ en rouge.

  4. Utiliser votre échantillon pour simuler n parties d'un jeu de pile ou face où la probabilité de gagner 1 euro est $ p$, la probabilité de perdre 1 euro est $ 1-p$. Calculer les valeurs successives de la fortune d'un joueur dont la fortune initiale est nulle (fonction cumsum). Représenter graphiquement ces valeurs (fonction plot).

  5. Calculer les valeurs successives de la moyenne empirique des $ i$ premières valeurs de l'échantillon initial, pour $ i$ allant de 1 à $ n$. Représenter graphiquement ces valeurs en bleu et superposer sur le même graphique la droite horizontale d'ordonnée $ p$ en rouge (fonction abline).

Exercice 5   On considère des algorithmes censés simuler des lancers de dé, bien que certains trichent...  Pour chacun de ces algorithmes :
  1. Vérifier que la valeur prise par $ D$ appartient à $ \{1,\ldots,6\}$.
  2. Déterminer la loi de $ D$.
  3. Implémenter l'algorithme.
  4. Tirer un échantillon de taille 10000 de $ D$, calculer les fréquences empiriques.
  5. Représenter graphiquement un diagramme en bâtons avec les fréquences empiriques en bleu et les fréquences théoriques en rouge.
Dans ces algorithmes, Random désigne un réel de loi uniforme sur $ [0,1]$, Floor désigne la partie entière, Round l'entier le plus proche, Mod le modulo.
$ \bullet$
$ X \longleftarrow $ Floor(Random $ *\;6$)$ + 1$
$ \bullet$
$ X \longleftarrow $ Round(Random $ *\;5$)$ + 1$
$ \bullet$
$ X \longleftarrow $ Floor(Random $ *\;10$)
$ X \longleftarrow X$ Mod $ 6 + 1$
$ \bullet$
$ X \longleftarrow $ Floor(Random $ *\;12$)
$ X \longleftarrow X$ Mod $ 6 + 1$
$ \bullet$
$ U \longleftarrow $ Random
$ X \longleftarrow $ Floor($ U*U*6$)$ + 1$
$ \bullet$
$ U \longleftarrow $ Random $ +$ Random
$ X \longleftarrow $ Floor($ U*3$)$ + 1$
$ \bullet$
Répéter
$ X \longleftarrow $ Floor(Random $ *\;10$) $ + 1$
Jusqu'à ( $ X\leqslant 6$)

Exercice 6   Les tailles des échantillons à simuler sont fixées à $ 10000$.
  1. Simuler un echantillon de lancers d'un dé. Pour chaque entier $ i$ entre 1 et $ n$, calculer la fréquence empirique des entiers supérieurs ou égaux à 3 parmi les $ i$ premiers. Représenter graphiquement ces valeurs en bleu et superposer sur le même graphique la droite horizontale d'ordonnée égale à la probabilité théorique en rouge. Calculer les valeurs successives de la moyenne empirique des i premières valeurs de l'échantillon initial, pour $ i$ allant de 1 à $ n$. Représenter graphiquement ces valeurs en bleu et superposer sur le même graphique la droite horizontale d'ordonnée égale à l'espérance théorique en rouge.

  2. Soit $ U$ une variable aléatoire de loi uniforme sur $ [0,1]$. On note $ N$ la partie entière de $ 1/U$. Montrer que pour tout entier $ n$ supérieur ou égal à 1, la probabilité que $ N$ prenne la valeur $ n$ est $ 1/n-1/(n+1)$. Simuler un échantillon de la loi uniforme sur $ [0,1]$, et en déduire un échantillon de la loi de N (fonction floor). Calculer les fréquences empiriques des entiers de 1 à 10. Représenter par un double diagramme en barre, les fréquences empiriques des entiers de 1 à 10 en bleu, et les probabilités théoriques en rouge.

  3. Simuler un echantillon de la loi de Poisson de paramètre 3. Calculer les fréquences empiriques des entiers de 1 à 10. Représenter par un double diagramme en barre, les fréquences empiriques des entiers de 1 à 10 en bleu, et les probabilités théoriques en rouge.

  4. Pour chaque entier $ i$ entre 1 et $ n$, calculer la fréquence empirique des entiers supérieurs ou égaux à 3 parmi les $ i$ premiers éléments de l'échantillon de la question précédente. Représenter graphiquement ces valeurs en bleu et superposer sur le même graphique la droite horizontale d'ordonnée égale à la probabilité théorique en rouge.

  5. Simuler un échantillon $ x$ de la loi $ \mathcal {N}(0,1)$. Pour $ (a=1, b=2)$, $ (a=-2, b=2)$, $ (a=-\infty, b=2.576)$, $ (a=-2.576, b=2.576)$ : calculer la fréquence empirique de l'intervalle $ [a,b]$ parmi les $ i$ premiers éléments de l'échantillon. Représenter graphiquement ces valeurs en bleu et superposer sur le même graphique la droite horizontale d'ordonnée égale à la probabilité théorique en rouge.

Exercice 7    
  1. Représenter sur le même graphique les densités des lois normales

    $\displaystyle \mathcal{N}(0,1)\;,\quad\mathcal{N}(0,10)\;,\quad \mathcal{N}(0,0.1)\;.$

    (fonctions curve et dnorm).

  2. Simuler un échantillon x de taille 1000 de la loi $ \mathcal {N}(0,1)$ (fonction rnorm).

  3. Représenter un histogramme de cet échantillon en bleu. Superposer sur le même graphique une estimation de la densié (fonction density) en vert et la densité exacte de la loi $ \mathcal {N}(0,1)$ en rouge.

  4. Représenter la fonction de répartition empirique de l'échantillon en bleu
    1. En appliquant la définition : fonction sort pour ranger par ordre croissant, type="step" dans plot pour une représentation en escalier).
    2. En utilisant la fonction ecdf.
  5. Superposer sur le même graphique la fonction de répartition de la loi $ \mathcal {N}(0,1)$ (fonctions pnorm et curve) en rouge.

  6. Calculer les valeurs successives de la moyenne empirique des $ i$ premières valeurs de l'échantillon initial, pour $ i$ allant de 1 à $ n$. Représenter graphiquement ces valeurs en bleu et superposer sur le même graphique la droite horizontale d'ordonnée 0 en rouge (fonction abline).

  7. Séparer l'échantillon initial $ x$ en deux échantillons de taille 500, et les ajouter pour en déduire un nouvel échantillon $ y$ (fonctions matrix et colSums). Représenter un histogramme de cet échantillon $ y$ en bleu. Superposer sur le même graphique la densité de la loi normale de moyenne nulle et de variance $ 2$, en rouge. Ouvrir une nouvelle fenêtre graphique. Représenter la fonction de répartition empirique de l'échantillon $ y$ en bleu. Superposer sur le même graphique la fonction de répartition de la loi normale de moyenne nulle et de variance $ 2$, en rouge.

  8. Tirer 1000 échantillons de taille 12 de la loi uniforme sur $ [-0.5,0.5]$ et calculer les 1000 sommes de ces échantillons : soit $ s$ l'échantillon de taille 1000 ainsi obtenu (fonctions matrix et rowSums). Représenter un histogramme de cet échantillon $ s$ en bleu. Superposer sur le même graphique la densité de la loi normale de moyenne nulle et de variance 1, en rouge. Représenter sur une nouvelle fenêtre graphique les points dont les abscisses sont les valeurs de la fonction quantile de la loi $ \mathcal {N}(0,1)$ (fonction qnorm) aux points $ 0.001,\ldots,0.999$, et en ordonnée les valeurs de $ s$ triées par ordre croissant, sauf la dernière. Comparer votre graphique avec celui obtenu par qqnorm(s).

Exercice 8   Pour les lois de probabilité $ P$ suivantes :
$ \bullet$
Lois binomiales $ {\cal B}(4,0.5) ,\;{\cal B}(4,0.2) ,\;{\cal B}(4,0.8) .
$
$ \bullet$
Lois sur $ \{0,\ldots,4\}$ définies par les probabilités suivantes :

\begin{displaymath}
\begin{array}{\vert ccccc\vert}
\hline
0&1&2&3&4\\
\hline\h...
....1&0.1&0.1\\
0.9&0.025&0.025&0.025&0.025\\
\hline
\end{array}\end{displaymath}

$ \bullet$
Lois uniformes $ {\cal U}(0,1) ,\;{\cal U}(0,100) .
$
$ \bullet$
Lois exponentielles $ {\cal E}(1) ,\;{\cal E}(0.1) .
$
$ \bullet$
Lois normales $ {\cal N}(0,1) ,\;{\cal N}(10,100) .
$
$ \bullet$
Lois Gamma $ {\cal G}(10,1) ,\;{\cal G}(100,1) .
$
  1. Simuler 1000 échantillons de taille $ 100$ de la loi $ P$.
  2. On note $ x^*$ l'échantillon des 1000 moyennes empiriques, centrées et réduites. Représenter un histogramme de l'échan-tillon $ x^*$ et superposer sur le même graphique la densité de la loi normale $ {\cal N}(0,1)$.
  3. Représenter la fonction de répartition empirique de l'échantillon $ x^*$ et superposer sur le même graphique la fonction de répartition de la loi normale $ {\cal N}(0,1)$.
  4. Idem pour l'échantillon des 1000 variances empiriques, centrées et réduites.
  5. Idem pour l'échantillon des 1000 écarts-types empiriques, centrés et réduits.
  6. Idem pour l'échantillon des 1000 médianes empiriques, centrées et réduites.

Exercice 9   Les tailles des échantillons à simuler sont fixées à $ 10000$.
  1. Soit $ U$ une variable aléatoire de loi uniforme sur $ [0,1]$. La variable aléatoire $ S=\sqrt{U}$ a pour fonction de répartition :

    $\displaystyle F_S(y)=\left\{\begin{array}{lcl}
0&\mbox{si}&y\leqslant 0\\
y^2&\mbox{si}&0<y\leqslant 1\\
1&\mbox{si}&y>1\;.
\end{array}\right.
$

    Elle a pour densité :

    $\displaystyle f_S(y)=\left\{\begin{array}{ll}
2y&\mbox{si }0<y< 1\\
0&\mbox{sinon}\;.
\end{array}\right.
$

    Simuler un échantillon de la loi uniforme sur $ [0,1]$, en déduire un échantillon de la loi de $ S$. Représenter la fonction de répartition empirique de l'échantillon en bleu. Superposer sur le même graphique la fonction de répartition de $ S$ en rouge. Représenter un histogramme de l'échantillon en bleu. L'histogramme aura 100 classes, de même amplitude entre 0 et 1. Superposer sur le même graphique la densité de $ S$ en rouge.

  2. Soit $ U$ une variable aléatoire de loi uniforme sur $ [-1,1]$. La variable aléatoire $ Z=U^2$ a pour fonction de répartition

    $\displaystyle F_Z(y)=\left\{\begin{array}{lcl}
0&\mbox{si}&y\leqslant 0\\
\sqrt{y}&\mbox{si}&0<y\leqslant 1\\
1&\mbox{si}&y>1\;.
\end{array}\right.
$

    Elle a pour densité

    $\displaystyle f_Z(y)=\left\{\begin{array}{ll}
\frac{1}{2\sqrt{y}}&\mbox{si }0<y\leqslant 1\\
0&\mbox{sinon}\;.
\end{array}\right.
$

    Simuler un échantillon de la loi uniforme sur $ [-1,1]$, et en déduire un échantillon de la loi de $ Z$. Représenter la fonction de répartition empirique de l'échantillon en bleu. Superposer sur le même graphique la fonction de répartition de $ Z$ en rouge. Représenter un histogramme de l'échantillon en bleu. L'histogramme aura 100 classes, de même amplitude entre 0 et 1. Superposer sur le même graphique la densité de $ Z$ en rouge.

  3. Soit $ U$ une variable aléatoire de loi uniforme sur [0,1]. La variable aléatoire $ V=1/U$ a pour fonction de répartition :

    $\displaystyle F_V(y)=\left\{\begin{array}{ll}
1-1/y&\mbox{si }y>1\\
0&\mbox{sinon}\;.
\end{array}\right.
$

    Elle a pour densité :

    $\displaystyle f_V(y)=\left\{\begin{array}{ll}
1/y^2&\mbox{si }y>1 1\\
0&\mbox{sinon}\;.
\end{array}\right.
$

    Simuler un échantillon de la loi uniforme sur $ [0,1]$, et en déduire un échantillon de la loi de $ V$. Choisir un réel $ L$ pour les représentations qui suivent (essayer plusieurs valeurs). Représenter la fonction de répartition empirique de l'échantillon en bleu, pour les abscisses comprises entre 0 et $ L$. Superposer sur le même graphique la fonction de répartition de $ V$ en rouge. Représenter un histogramme de l'échantillon en bleu. L'histogramme aura 100 classes de même amplitude, entre 0 et $ L$. Superposer sur le même graphique la densité de V en rouge.

  4. Soit $ U$ une variable aléatoire de loi uniforme sur $ [- \pi/2,\pi/2]$. La variable aléatoire $ C=\tan(U)$ a pour fonction de répartition :

    $\displaystyle F_C(y)=\frac{1}{\pi}\arctan(y)+ \frac{1}{2}\;.
$

    Elle a pour densité :

    $\displaystyle f_C(y)=\frac{1}{\pi(1+y2)}\;.
$

    Simuler un échantillon de la loi uniforme sur $ [- \pi/2,\pi/2]$, et en déduire un échantillon de la loi de $ C$. Choisir un réel $ L$ pour les représentations qui suivent (essayer plusieurs valeurs). Représenter la fonction de répartition empirique de l'échantillon en bleu, pour les abscisses comprises entre $ -L$ et $ L$. Superposer sur le même graphique la fonction de répartition de $ C$ en rouge. Représenter un histogramme de l'échantillon en bleu. L'histogramme aura 100 classes, de même amplitude entre 0 et $ L$. Superposer sur le même graphique la densité de $ V$ en rouge.

Exercice 10   Pour les lois de probabilité $ P$ suivantes :
$ \bullet$
Lois uniformes $ {\cal U}(0,1) ,\;{\cal U}(0,100) .
$
$ \bullet$
Lois exponentielles $ {\cal E}(1) ,\;{\cal E}(0.1) .
$
$ \bullet$
Lois normales $ {\cal N}(0,1) ,\;{\cal N}(10,100) .
$
$ \bullet$
Lois Gamma $ {\cal G}(10,1) ,\;{\cal G}(100,1) .
$
$ \bullet$
Lois de Student $ {\cal T}(1) ,\;{\cal T}(100) .
$
$ \bullet$
Lois de Fisher $ {\cal F}(2,2) ,\;{\cal F}(20,20) .
$
  1. Simuler un échantillon $ x$ de taille $ 1000$ de la loi $ P$.
  2. Pour $ i=0,\ldots,20$, on note :

    $\displaystyle a_i=\min\{x\} + \frac{i}{20} (\max\{x\} - \min\{x\})\;.
$

    Calculer les fréquences empiriques des 20 classes
    $ [a_{i-1},a_i]$ ( $ i=1,\ldots,20$). Superposer sur un même graphique un histogramme de ces fréquences empiriques et la densité de la loi $ P$.
  3. Idem si les $ a_i$ sont les statistiques d'ordre d'un échantillon de taille 21 de la loi uniforme $ {\cal U}(\min\{x\},\max\{x\})$.
  4. Idem si les $ a_i$ sont les statistiques d'ordre d'un échantillon de taille 21 de la loi $ P$.

Exercice 11   Les tailles des échantillons à simuler sont fixées à $ 10000$.
  1. Simuler un échantillon $ x$ de la loi normale $ \mathcal{N}(1,4)$ et un échantillon y de la loi normale $ \mathcal {N}(0,1)$. Calculer $ z=x+2y$.
    1. Représenter dans le plan les couples de points (xi,zi).

    2. Représenter un histogramme des valeurs de $ z$. Superposer sur le même graphique la densité de la loi normale $ \mathcal{N}(1,8)$. Représenter la fonction de répartition empirique de $ z$. Superposer sur le même graphique la fonction de répartition de la loi normale $ \mathcal{N}(1,8)$.

    3. Pour i allant de 1 à 10000, calculer la covariance empirique des $ i$ premières valeurs des échantillons $ x$ et $ z$. Représenter graphiquement ces valeurs. Superposer sur le même graphique la droite horizontale dont l'ordonnée est égale à la covariance théorique $ (4)$.
  2. Simuler 3 échantillons $ x_1$, $ x_2$, $ x_3$, de lois respectives

    $\displaystyle \mathcal{N}(4,0.01)\;,\quad
\mathcal{N}(1,0.01)\;,\quad
\mathcal{N}(5,0.01)\;.
$

    Calculer les échantillons $ z=x_1-x_2$ et $ t=x_1+x_3$.
    1. Représenter dans le plan les couples de points dont les abscisses sont les valeur de $ z$, les ordonnées les valeurs de $ t$.

    2. Représenter un histogramme des valeurs de $ z$. Superposer sur le même graphique la densité de la loi normale N$ (3,0.02)$. Représenter la fonction de répartition empirique de $ z$. Superposer sur le même graphique la fonction de répartition de la loi normale $ \mathcal{N}(3,0.02)$.

    3. Représenter un histogramme des valeurs de $ t$. Superposer sur le même graphique la densité de la loi normale $ \mathcal{N}(9,0.02)$. Représenter la fonction de répartition empirique de $ t$. Superposer sur le même graphique la fonction de répartition de la loi normale $ \mathcal{N}(9,0.02$).

    4. Pour $ i$ allant de 1 à 10000, calculer la covariance empirique des $ i$ premières valeurs des échantillons $ z$ et $ t$. Représenter graphiquement ces valeurs. Superposer sur le même graphique la droite horizontale dont l'ordonnée est égale à la covariance théorique ($ 0.01$).
  3. Simuler $ 2$ échantillons de la loi normale $ \mathcal {N}(0,1)$ : $ x$ et $ y$. Calculer l'échantillon $ z=x^2+y^2$. Représenter une estimation de la densité de $ z$. Superposer sur le même graphique la densité de la loi du chi-deux à $ 2$ degrés de liberté. Représenter la fonction de répartition empirique de $ z$. Superposer sur le même graphique la fonction de répartition de la loi du chi-deux à $ 2$ degrés de liberté.
  4. Reprendre la question précédente avec 4 échantillons de la loi $ \mathcal {N}(0,1)$ et la loi du chi-deux à 4 degrés de liberté.
  5. Calculer la moyenne empirique $ m=(x_1+\cdots+x_n)/n$. Calculer l'échantillon $ z=y-n m^2$. Représenter un histogramme des valeurs de $ z$. Superposer sur le même graphique la densité de la loi du chi-deux à $ (n-1)$ degrés de liberté. Représenter la fonction de répartition empirique de $ z$. Superposer sur le même graphique la fonction de répartition de la loi du chi-deux à $ (n-1)$ degrés de liberté.

Exercice 12   Pour les lois de probabilité $ P$ suivantes :
$ \bullet$
Lois binomiales $ {\cal B}(4,0.5) ,\;{\cal B}(4,0.2) ,\;{\cal B}(4,0.8) .
$
$ \bullet$
Lois sur $ \{0,\ldots,4\}$ définies par les probabilités suivantes :

\begin{displaymath}
\begin{array}{\vert ccccc\vert}
\hline
0&1&2&3&4\\
\hline\h...
....1&0.1&0.1\\
0.9&0.025&0.025&0.025&0.025\\
\hline
\end{array}\end{displaymath}

  1. Simuler 100 échantillons de taille $ 1000$ de la loi $ P$. Pour chacun des 100 échantillons, calculer la distance du chi-deux de sa distribution empirique par rapport à la distribution théorique $ P$. Soit $ x$ l'échantillon de taille $ 100$ des valeurs prises par la distance du chi-deux, multipliées par $ 1000$.
  2. Superposer sur un même graphique un histogramme de l'échantillon $ x$, et la densité de la loi de chi-deux à 4 degrés de liberté.
  3. Superposer sur un même graphique la fonction de répartition empirique de l'échantillon $ x$ et la fonction de répartition $ F_{{\cal X}^2(4)}$ de la loi de chi-deux à 4 degrés de liberté.
  4. Ajustement par quantiles : former le vecteur $ y$, des centiles de la loi de chi-deux : $ Q_{{\cal X}^2(4)}(i/100) , i=1,\ldots, 99$. On note $ (x_{(i)})_{i=1,\ldots,n}$ les statistiques d'ordre de $ x$ (valeurs rangées par ordre croissant). Représenter sur un même graphique le nuage des points $ (x_{(i)},y_i)$ et la première bissectrice.

Exercice 13   Pour les lois de probabilité $ P$ suivantes :
$ \bullet$
Lois binomiales $ {\cal B}(30,0.5) ,\;{\cal B}(30,0.1)
 ,\;{\cal B}(100,0.1)\;.
$
$ \bullet$
Lois de Poisson $ {\cal P}(30) ,\;{\cal P}(100) .
$
$ \bullet$
Lois de Student $ {\cal T}(10) ,\;{\cal T}(30) ,\;{\cal T}(100) .
$
$ \bullet$
Lois Gamma $ {\cal G}(10,1) ,\;{\cal G}(30,1) ,\; {\cal G}(100,1) .
$
  1. Simuler un échantillon de taille $ 100$ de la loi $ P$. Soit $ y$ l'échantillon formé des 99 premières statistiques d'ordre des valeurs simulées. Soit $ x=(Q_{{\cal N}(0,1)}(i/100)) , i=1,\ldots,99$, le vecteur des centiles de la loi $ {\cal N}(0,1)$.
  2. Calculer $ \overline{x}$, $ s_x^2$, $ \overline{y}$, $ s_y^2$, $ c_{xy}$, $ r_{xy}$.
  3. Calculer les coefficients $ \widehat{a}$ et $ \widehat{b}$ de la droite de régression linéaire de $ y$ sur $ x$. Représenter le nuage des points $ (x_i,
y_i)$ et la droite de régression linéaire sur le même graphique.
  4. Comparer les valeurs de $ \widehat{b}$ et $ \widehat{a}$ à l'espérance et à l'écart-type de la loi $ P$.
  5. Représenter sur le même graphique un histogramme de l'échantillon $ y$ et la densité de la loi normale de même espérance et de même variance que la loi $ P$.

Exercice 14   Choisir deux réels $ c$ et $ d$ tels que $ c<d$. Simuler un échantillon de taille $ 100$ de la loi uniforme $ {\cal U}(c,d)$. Soit $ y$ l'échantillon des statistiques d'ordre des valeurs simulées et $ x=(i/100) , i=1,\ldots,100$.
  1. Calculer $ \overline{x}$, $ s_x^2$, $ \overline{y}$, $ s_y^2$, $ c_{xy}$, $ r_{xy}$.
  2. Calculer les coefficients $ \widehat{a}$ et $ \widehat{b}$ de la droite de régression linéaire de $ y$ sur $ x$. Représenter le nuage des points $ (x_i,
y_i)$ et la droite de régression linéaire sur le même graphique.
  3. Comparer les valeurs de $ \widehat{b}$ et $ \widehat{a}$ à $ c$ et $ d\!-\!c$.

Exercice 15   Choisir deux réels $ \mu$ et $ \sigma>0$. Simuler un échantillon de taille $ 100$ de la loi normale $ {\cal N}(\mu,\sigma^2)$. Soit $ y$ l'échantillon des $ 99$ premières statistiques d'ordre des valeurs simulées. Soit $ x=(Q_{{\cal N}(0,1)}(i/100)) , i=1,\ldots,99$, le vecteur des centiles de la loi $ {\cal N}(0,1)$.
  1. Calculer $ \overline{x}$, $ s_x^2$, $ \overline{y}$, $ s_y^2$, $ c_{xy}$, $ r_{xy}$.
  2. Calculer les coefficients $ \widehat{a}$ et $ \widehat{b}$ de la droite de régression linéaire de $ y$ sur $ x$. Représenter le nuage des points $ (x_i,
y_i)$ et la droite de régression linéaire sur le même graphique.
  3. Comparer les valeurs de $ \widehat{b}$ et $ \widehat{a}$ à $ \mu$ et $ \sigma$.

Exercice 16   Choisir deux réels $ c>0$ et $ \lambda>0$. Simuler un échantillon $ e$ de taille $ 100$ de la loi de Weibull $ {\cal W}(c,\lambda)$. Soit $ y = (\log(e_{(i)}) , i=1,\ldots,99$, où les $ e_{(i)}$ sont les $ 99$ premières statistiques d'ordre des valeurs simulées. Soit $ x=(\log(-\log(1-i/100))) , i=1,\ldots,99$.
  1. Calculer $ \overline{x}$, $ s_x^2$, $ \overline{y}$, $ s_y^2$, $ c_{xy}$, $ r_{xy}$.
  2. Calculer les coefficients $ \widehat{a}$ et $ \widehat{b}$ de la droite de régression linéaire de $ y$ sur $ x$. Représenter le nuage des points $ (x_i,
y_i)$ et la droite de régression linéaire sur le même graphique.
  3. Comparer les valeurs de $ \widehat{a}$ et $ \widehat{b}$ à $ (1/c)$ et $ (1/c)\log(1/\lambda)$.

Exercice 17   Soit $ (X_1,\ldots,X_n)$ un échantillon de la loi uniforme sur $ [0,\theta]$$ \theta$ est un paramètre inconnu. On note $ (X_{(1)},\ldots,X_{(n)})$ les statistiques d'ordre de l'échantillon (valeurs de l'échantillon rangées par ordre croissant. On considère les estimateurs convergents suivants du paramètre $ \theta$ ( $ \lfloor\:\rfloor$ désigne la partie entière).
$\displaystyle T_1$ $\displaystyle =$ $\displaystyle \frac{2}{n}(X_1+\cdots+X_n)$  
$\displaystyle T_2$ $\displaystyle =$ $\displaystyle \frac{3}{n}(X_1^2+\cdots+X_n^2) ^{1/2}$  
$\displaystyle T_3$ $\displaystyle =$ $\displaystyle \frac{4}{n}(X_1^3+\cdots+X_n^3)^{1/3}$  
$\displaystyle T_4$ $\displaystyle =$ $\displaystyle \frac{3}{2n}(X_1^{1/2}+\cdots+X_n^{1/2})^2$  
$\displaystyle T_5$ $\displaystyle =$ $\displaystyle \frac{1}{2n} (X_1^{-1/2}+\ldots+X_n^{-1/2})^{-2}$  
$\displaystyle T_6$ $\displaystyle =$ $\displaystyle \mathrm{e}^1 (X_1\ldots X_n)^{1/n}$  
$\displaystyle T_7$ $\displaystyle =$ $\displaystyle 4 X_{\lfloor n/4\rfloor}$  
$\displaystyle T_8$ $\displaystyle =$ $\displaystyle 2 X_{\lfloor n/2\rfloor}$  
$\displaystyle T_9$ $\displaystyle =$ $\displaystyle \frac{3}{2} X_{\lfloor 2n/3\rfloor}$  
$\displaystyle T_{10}$ $\displaystyle =$ $\displaystyle \frac{4}{3} X_{\lfloor 3n/4\rfloor}$  
$\displaystyle T_{11}$ $\displaystyle =$ $\displaystyle \max \{X_1,\ldots,X_n\}$  
$\displaystyle T_{12}$ $\displaystyle =$ $\displaystyle \frac{n+1}{n} \max\{X_1,\ldots,X_n\}$  

  1. Choisir une valeur de $ \theta$ et simuler 1000 échantillons de taille 100 de la loi uniforme sur $ [0,\theta]$. Calculer pour chacun de ces échantillons la valeur prise par les 12 estimateurs.

  2. Calculer la moyenne empirique, et la variance empirique des 12 échantillons de taille 1000 ainsi obtenus. En déduire une estimation du biais et de l'erreur quadratique de chacun des 12 estimateurs.

  3. À partir des échantillons de la question 1, représenter sur un même graphique les diagrammes en boîte (boxplot) des 12 estimateurs. Superposer sur le même graphique la vraie valeur du paramètre, en rouge.

  4. À partir des échantillons de la question 1, représenter des histogrammes pour les 12 estimateurs, avec les mêmes échelles. Représenter sur chaque graphique la valeur exacte de $ \theta$ par une ligne verticale rouge. Représenter par deux lignes verticales jaunes les bornes de l'intervalle de confiance de niveau 0.95 pour l'espérance de l'estimateur.

Exercice 18   Soit $ (X_1,\ldots,X_n)$ un échantillon de la loi exponentielle $ {\cal E}(\lambda)$, où $ \lambda$ est un paramètre inconnu. On considère les estimateurs suivants du paramètre $ \lambda$. On admettra que ce sont tous des estimateurs convergents.
$ \bullet$
$ T_{1,n} = \displaystyle{\left(\frac{1}{n}(X_1+\cdots+X_n)\right)^{-1}}$
$ \bullet$
$ T_{2,n} = \displaystyle{\left(\frac{1}{2n}(X_1^2+\cdots+X_n^2)
\right)^{-1/2}}$
$ \bullet$
$ T_{3,n} = \displaystyle{\frac{\mathrm{e}^{-X_1}+\cdots+\mathrm{e}^{-X_n}}
{n-\mathrm{e}^{-X_1}-\cdots-\mathrm{e}^{-X_n}}}$
$ \bullet$
$ T_{4,n} = \displaystyle{\frac{\log(2)}{X_{(\lceil\frac{n}{2}\rceil)}}}$
$ \bullet$
$ T_{5,n} = \displaystyle{\frac{\log(4/3)}{X_{(\lceil\frac{n}{4}\rceil)}}}$
$ \bullet$
$ T_{6,n} = \displaystyle{\frac{\log(4)}{X_{(\lceil\frac{3n}{4}\rceil)}}}$
(Pour $ u\in ]0,1[$, $ \lceil \nu\rceil$ désigne l'entier $ i$ tel que $ i\!-\!1<\nu\leqslant i$, et $ X_{(i)}$ est la $ i$-ième statistique d'ordre de l'échantillon.)
  1. Choisir une valeur de $ \lambda$ et simuler $ 1000$ échantillons de taille $ 100$ de la loi $ {\cal E}(\lambda)$. Calculer pour chacun de ces échantillons la valeur prise par les 6 estimateurs. Calculer la moyenne empirique, et la variance empirique des 6 échantillons de taille 1000 ainsi obtenus. En déduire une estimation du biais et de l'erreur quadratique de chacun des 6 estimateurs.
  2. À partir des échantillons de la question 1, représenter sur un même graphique les diagrammes en boîte (boxplot) des 6 estimateurs. Superposer sur le même graphique la vraie valeur du paramètre, en rouge.

  3. À partir des échantillons de la question 1, représenter des histogrammes pour les 6 estimateurs, et proposer des intervalles de dispersion de niveau $ 0.9$.
  4. Proposer un classement des 6 estimateurs.

Exercice 19   Soit $ X$ une variable aléatoire de loi de Poisson $ {\cal P}(\lambda)$ et $ k\geqslant 1$ un entier. On admettra que pour tout $ k\geqslant 1$ :

$\displaystyle \mathbb{E}[X(X-1)\cdots(X-k+1)] = \lambda^k\;.
$

Soit $ (X_1,\ldots,X_n)$ un échantillon de la loi $ {\cal P}(\lambda)$. On pose :

$\displaystyle T_{k,n} = \frac{1}{n} \sum_{i=1}^n X_i(X_i-1)\cdots(X_i-k+1)\;.
$

La statistique $ (T_{k,n}^{1/k})$ est donc un estimateur convergent de $ \lambda$.
  1. Choisir une valeur de $ \lambda$. Simuler 1000 échantillons de taille 100 de la loi $ {\cal P}(\lambda)$. Pour chacun des 1000 échantillons, calculer la valeur prise par les estimateurs $ (T_{k,n}^{1/k})$, pour $ k=1,2,3,4$. On obtient ainsi un échantillon de taille 1000 pour chacun des 4 estimateurs.
  2. Pour chacun des 4 échantillons de la question précédente, représenter un histogramme, calculer la moyenne empirique et la variance empirique. En déduire une estimation du biais et de l'erreur quadratique des 4 estimateurs par rapport à $ \lambda$.
  3. Proposer un classement des 4 estimateurs.

Exercice 20   Pour chacune des lois $ P$ suivantes :
$ \bullet$
Lois binomiales $ {\cal B}(10,0.5) , {\cal B}(10,0.1) .$
$ \bullet$
Lois géométriques $ {\cal G}(0.1) , {\cal G}(0.9) .$
$ \bullet$
Lois de Poisson $ {\cal P}(0.1) , {\cal P}(10) .$
$ \bullet$
Lois uniformes $ {\cal U}(0,0.1) , {\cal U}(0,10) .$
$ \bullet$
Lois exponentielles $ {\cal E}(0.1) , {\cal E}(10) .$
$ \bullet$
Lois normales $ {\cal N}(0,0.1) , {\cal N}(0,100) .$
  1. Donner la valeur de l'espérance $ \mu$, de la variance $ \sigma^2$ et de l'écart-type $ \sigma$ de la loi $ P$.
  2. Simuler 1000 échantillons de taille 20 de la loi $ P$, et calculer pour chacun la valeur prise par la moyenne empirique $ \overline{X}$, la variance empirique $ S^2$, la variance empirique non biaisée $ V$, ainsi que par $ \sqrt{S^2}$ et $ \sqrt{V}$. On obtient ainsi $ 5$ échantillons de taille 1000 de ces estimateurs. Utiliser ces 5 échantillons pour estimer le biais et l'erreur quadratique moyenne de $ \overline{X}$ par rapport à $ \mu$, de $ S^2$ et $ V$ par rapport à $ \sigma^2$, et de $ \sqrt{S^2}$ et $ \sqrt{V}$ par rapport à $ \sigma$.

Exercice 21   Le but de l'exercice est de comparer les estimateurs des paramètres $ \mu$ et $ \sigma^2$ de la loi normale $ {\cal N}(\mu,\sigma^2)$, obtenus par la moyenne et la variance empirique, et par régression au sens des moindres carrés.
  1. Choisir deux valeurs pour $ \mu$ et $ \sigma^2$. Simuler 1000 échantillons de taille 100 de la loi $ {\cal N}(\mu,\sigma^2)$.
  2. Pour chacun des 1000 échantillons, déterminer la moyenne empirique, et la variance empirique non biaisée. On obtient ainsi un échantillon de taille 1000 pour chacun des 2 estimateurs : représenter un histogramme.
  3. Pour chacun des 1000 échantillons, calculer la série des statistiques d'ordre et déterminer les valeurs de $ \mu$ et $ \sigma^2$ déduites de la régression au sens des moindres carrés de ces statistiques d'ordre. Pour ces 1000 nouvelles estimations des deux paramètres, représenter des histogrammes, calculer les moyennes et les variances empiriques. En déduire une estimation du biais et de l'erreur quadratique des 2 estimateurs par rapport à $ \mu$ et $ \sigma^2$ respectivement.
  4. Laquelle des deux méthodes conduit aux meilleurs estimateurs ?

Exercice 22   Pour chacune des lois $ P$ suivantes :
$ \bullet$
loi binomiale $ {\cal B}(15,0.5)$, $ {\cal B}(15,0.9)$, $ {\cal B}(150,0.05)$.
$ \bullet$
loi de Poisson $ {\cal P}(1)$, $ {\cal P}(5)$.
$ \bullet$
loi géométrique $ {\cal G}(0.5)$, $ {\cal G}(0.2)$. $ {\cal G}(0.1)$.
$ \bullet$
loi exponentielle $ {\cal E}(1)$, $ {\cal E}(0.5)$, $ {\cal E}(0.1)$.
$ \bullet$
loi normale $ {\cal N}(1,9)$, $ {\cal N}(1,25)$, $ {\cal N}(-10,100)$.
$ \bullet$
loi gamma $ {\cal G}(10,0.04)$, $ {\cal G}(10,0.1)$, $ {\cal G}(5,0.02)$.
$ \bullet$
loi du chi-deux $ {\cal X}^2(1)$, $ {\cal X}^2(3)$.
$ \bullet$
loi de Student $ {\cal T}(1)$, $ {\cal T}(10)$.
$ \bullet$
loi de Fisher $ {\cal F}(1,1)$, $ {\cal F}(10,1)$, $ {\cal F}(1,10)$.
  1. Représenter graphiquement le diagramme en bâtons (lois discrètes) ou la densité (lois continues).
  2. Une statistique de test $ T$ prend la valeur $ 10$. Quelle décision prenez-vous au seuil $ \alpha=0.05$ pour un test unilatéral à droite, si la loi de $ T$ sous $ {\cal H}_0$ est $ P$.
  3. Pour le même test, calculer la p-valeur correspondant à $ T=10$.
  4. Reprendre les questions précédentes pour le test bilatéral de seuil $ \alpha=0.05$.

Exercice 23   On considère les algorithmes suivants :
a)
$ T\longleftarrow 0$
Répéter $ n$ fois
Si ( $ 0.4\leqslant$ Random $ \leqslant 0.9$) alors $ T\longleftarrow T+1$
finSi
finRépéter
b)
$ T\longleftarrow 0$
Répéter $ n$ fois
$ X \longleftarrow $ Random ; $ Y\longleftarrow$ Random
Si ($ X<Y$) alors $ T\longleftarrow T+1$
finSi
finRépéter
c)
$ T\longleftarrow 0$
Répéter $ n$ fois
$ X \longleftarrow $ Random ; $ Y\longleftarrow$ Random
Si ($ X^2+Y^2<1$) alors $ T\longleftarrow T+1$
finSi
finRépéter
d)
$ T\longleftarrow 0$
Répéter $ n$ fois
$ X \longleftarrow $ Random ; $ Y\longleftarrow$ Random ; $ Z\longleftarrow$ Random
Si ($ X<Y$ et $ X<Z$) alors $ T\longleftarrow T+1$
finSi
finRépéter
L'hypothèse nulle $ {\cal H}_0$ est que les appels successifs de Random sont des variables aléatoires indépendantes, de loi $ {\cal U}(0,1)$.
  1. Montrer que sous l'hypothèse $ {\cal H}_0$, $ T$ suit une loi binomiale $ {\cal B}(n,p)$, et déterminer la valeur de $ p$ pour chacun des algorithmes.
  2. Pour chacun des algorithmes, écrire une fonction qui prend en entrée une valeur de $ n$, qui exécute $ n$ fois l'algorithme, et qui retourne en sortie la p-valeur du test bilatéral de proportion pour la valeur de $ p$ (fonction prop.test).
  3. Pour $ n=100$, exécuter $ 1000$ fois l'algorithme et représenter un histogramme des p-valeurs obtenues.

Exercice 24   On considère l'algorithme suivant. $ T\longleftarrow 0$
Répéter $ n$ fois
TantQue Random $ >p$
$ T\longleftarrow T+1$
finTantQue
finRépéter L'hypothèse $ {\cal H}_0$ est que les appels successifs de Random sont des variables aléatoires indépendantes de loi $ {\cal U}(0,1)$. Sous cette hypothèse, on montrera, ou on admettra qu'en sortie de l'algorithme, $ T$ suit la loi binomiale négative $ {\cal BN}(n,p)$. Pour $ n=5,  10,  100$ et $ p=0.1,  0.5, 0.9$ :
  1. Calculer un intervalle de dispersion symétrique pour la loi $ {\cal BN}(n,p)$, de niveau 0.95.
  2. En déduire un test bilatéral de seuil 0.05 pour $ {\cal H}_0$.
  3. Exécuter l'algorithme 1000 fois. Représenter sur le même graphique le diagramme en bâtons des 1000 valeurs de $ T$ obtenues, et celui de la loi $ {\cal BN}(n,p)$.
  4. Appliquer le test aux 1000 valeurs et compter le nombre de rejets. En déduire une estimation de la probabilité de rejet.
  5. Pour chacune des 1000 valeurs, calculer la p-valeur relative à la loi $ {\cal BN}(n,p)$.

Exercice 25   Soit $ (X_1,\ldots,X_n)$ un échantillon de la loi $ P$. On considère l'hypothèse $ {\cal H}_0 :  P={\cal U}(0,1)$. Pour tester la valeur du quantile de $ P$ en $ u$, on utilise la statistique :

$\displaystyle T_u = \sum_{i=1}^n \mathbb{I}_{(-\infty,u]}(X_i)\;,
$

qui suit la loi binomiale $ {\cal B}(n,u)$ sous $ {\cal H}_0$.

Pour $ u=0.25,  0.5,  0.75$ et les lois $ P$ suivantes :

$ \bullet$
lois uniformes $ {\cal U}(0,0.9)$, $ {\cal U}(0,1)$, $ {\cal U}(0,1.1)$.
$ \bullet$
lois bêta $ {\cal B}(0.9,1.1)$, $ {\cal B}(1.1,1.1)$, $ {\cal U}(1.1,0.9)$.
  1. Simuler 1000 échantillons de taille 100 de la loi $ P$ et calculer pour chacun la valeur prise par $ T_u$.
  2. Appliquer le test au seuil $ \alpha=0.05$ et compter le nombre de rejets.
  3. Représenter sur un même graphique le diagramme en bâtons des 1000 valeurs de $ T_u$ et celui de la loi binomiale $ {\cal B}(100,u)$.

Exercice 26   Soit $ (X_1,\ldots,X_n)$ un échantillon de la loi $ P_0$ et $ (Y_1,\ldots,Y_n)$ un échantillon de la loi $ P_1$, indépendant du précédent. On considère l'hypothèse $ {\cal H}_0 : P_0=P_1$. Le test des signes est basé sur la statistique :

$\displaystyle T=\sum_{i=1}^n \mathbb{I}_{X_i<Y_i}\;,
$

qui suit la loi binomiale $ {\cal B}(n,1/2)$ sous $ {\cal H}_0$. On suppose que $ P_0$ est la loi uniforme $ {\cal U}(0,1)$ et on considère les lois $ P_1$ suivantes :
$ \bullet$
lois uniformes $ {\cal U}(0,0.9)$, $ {\cal U}(0,1)$, $ {\cal U}(0,1.1)$.
$ \bullet$
lois bêta $ {\cal B}(0.9,1.1)$, $ {\cal B}(1.1,1.1)$, $ {\cal B}(1.1,0.9)$.
  1. Simuler 1000 échantillons de taille 100 de la loi $ P_0$ et de la loi $ P_1$. Calculer pour chacun la valeur prise par $ T$.
  2. Appliquer le test au seuil $ \alpha=0.05$ et compter le nombre de rejets.
  3. Représenter sur un même graphique le diagramme en bâtons des 1000 valeurs de $ T$ et celui de la loi binomiale $ {\cal B}(100,0.5)$.
  4. Reprendre les questions 2 et 3 en utilisant :
    1. le test de Kolmogorov-Smirnov (fonciton ks.test)
    2. le test de Wilcoxon (fonction wilcox.test)

Exercice 27   Soit $ (X_1,\ldots,X_n)$ un échantillon de taille $ n=30$ de la loi $ P$. On souhaite tester au seuil $ \alpha=0.05$ :

$\displaystyle {\cal H}_0\;:\;P={\cal U}(0,1)$   contre$\displaystyle \quad
{\cal H}_1\;:\;P={\cal B}(2,1)\;.
$

(Loi uniforme sur $ [0,1]$ contre loi bêta de parmètres 2 et 1). On envisage pour cela les tests suivants :
a)
Test du rapport de vraisemblance. La statistique de test est $ T_a=-\sum \log(X_i)$. Elle suit la loi $ {\cal G}(n,1)$ sous $ {\cal H}_0$, la loi $ {\cal G}(n,2)$ sous $ {\cal H}_1$.
b)
Test de la médiane. La statistique de test est $ T_b=\sum \mathbb{I}_{[0,1/2]}(X_i)$. Elle suit la loi $ {\cal B}(n,1/2)$ sous $ {\cal H}_0$, la loi $ {\cal B}(n,1/4)$ sous $ {\cal H}_1$.
c)
Test sur la valeur de la moyenne empirique. La statistique de test est $ T_c=\overline{X}$. Sa loi est approximativement normale, de paramètres $ (\frac{1}{2},\frac{1}{12 n})$ sous $ {\cal H}_0$, $ (\frac{2}{3}, \frac{1}{18 n})$ sous $ {\cal H}_1$.
d)
Test de Kolmogorov-Smirnov.
e)
Test du chi-deux. On considérera un découpage de l'intervalle $ [0 ,1]$ en 10 classes d'amplitudes égales.
  1. Pour les trois premiers tests, calculer la règle de décision, puis la puissance du test.
  2. Simuler 1000 échantillons de taille 30 de la loi bêta $ {\cal B}(2,1)$.
    1. Appliquer les 5 tests à chacun des 1000 échantillons et compter le nombre de rejets. En déduire une estimation de la puissance de chaque test.
    2. Proposer un classement des 5 tests, du plus au moins puissant.

Exercice 28   Si on joue à un jeu de hasard pour lequel la probabilité de gagner est strictement inférieure à $ 1/2$, on est sûr de se ruiner au bout d'un temps plus ou moins long. Si on gagne $ 1$ euro avec probabilité $ p<1/2$, et on perd $ 1$ euro avec probabilité $ 1-p$, alors partant d'une fortune initiale égale à $ a$, on se ruine en moyenne au bout d'un temps égal à $ a/(1-2p)$.

Écrire une fonction qui prend en entrée deux entiers $ a$ et $ n$ et un réel $ p$ strictement compris entre 0 et $ 1/2$. La fonction simule $ n$ trajectoires partant d'une fortune initiale $ a$, d'un jeu pour lequel la probabilité de gagner $ + 1$ est $ p$ et la probabilité de perdre $ -1$ est $ 1-p$. Pour chaque trajectoire elle calcule l'instant de ruine, à savoir le premier instant pour lequel la fortune atteint 0. Elle trace un diagramme en bâtons pour les valeurs des instants de ruine, et retourne un intervalle de confiance pour son espérance.

Exercice 29   Écrire une fonction qui prend en entrée une chaîne de caractères chaine donnant le nom d'une loi, parmi unif, norm, gamma, weibull, beta, logis, lnorm, deux paramètres réels $ a$ et $ b$ et un entier $ n$.

La fonction simule un échantillon de taille $ n$ de la loi chaine ayant pour paramètres $ a$ et $ b$. Elle ouvre une fenêtre graphique qu'elle divise en 2 sous-fenêtres. Elle affiche dans ces 2 fenêtres.

  1. Un histogramme des valeurs de l'échantillon avec la densité de la loi.
  2. La fonction de répartition empirique avec la fonction de répartition théorique.

Exercice 30   Écrire une fonction qui prend en entrée trois vecteurs $ p=(p_i)_{i=1,\ldots,d}$, $ \mu=(\mu_i)_{i=1,\ldots,d}$ et $ \sigma=(\sigma_i)_{i=1,\ldots,d}$. Le vecteur $ p$ est une loi de probabilité sur $ \{1,\ldots,d\}$. Par exemple :

$\displaystyle p=(1/6,1/2,1/3)\;,\quad \mu = (-2,0,3)\;,\quad \sigma =
(0.2,1,2)\;. $

La fonction simule un échantillon de taille $ n$ de la loi mélange, telle que chaque composante est tirée selon la loi normale $ {\cal
N}(\mu_i,\sigma_i^2$ avec probabilité $ p_i$. Elle ouvre une fenêtre graphique qu'elle divise en 2 sous-fenêtres. Elle affiche dans ces 2 fenêtres.

  1. Un histogramme des valeurs de l'échantillon avec la densité de la loi théorique.
  2. La fonction de répartition empirique avec la fonction de répartition théorique.

Exercice 31   Écrire une fonction qui prend en entrée $ 3$ réels $ \sigma_1$, $ \sigma_2$ et $ \rho$ et un entier $ n$. Le réel $ \rho$ doit être strictement compris entre $ -1$ et $ 1$. La fonction tire deux échantillons $ u_1$ et $ u_2$, de taille $ n$, de la loi normale $ {\cal N}(0,1)$. Elle calcule les échantillons

$\displaystyle x = \sigma_1 u_1$   et$\displaystyle y =
\sigma_2\rho u_1+\sigma_2\sqrt{1-\rho^2} u_2\;. $

Elle ouvre une fenêtre graphique qu'elle divise en deux. Elle affiche dans ces fenêtres.

  1. Les points dont les abscisses sont les valeurs de l'échantillon $ x$, les ordonnées sont les valeurs de l'échantillon $ y$.
  2. La surface d'équation $ z=f(x,y)$, où

    $\displaystyle f(x,y)=\frac{1}{2\pi \sigma_1\sigma_2\sqrt{1-\rho^2}}
 \exp\left(-\frac{1}{2}(x,y) K^{-1} \binom{x}{y}\right)\;,
$

    $ K^{-1}$ est la matrice inverse de la matrice de covariance $ K$ :

    $\displaystyle K= \left( \begin{array}{cc}
\sigma_1^2&\sigma_1\sigma_2\rho\\
\sigma_1\sigma_2\rho&\sigma_2^2 \end{array}\right)
$


         © UJF Grenoble, 2011                              Mentions légales