Mesures numériques des données

L'un des principaux objectifs de la statistique est d'extraire des informations des données. Pour cela, nous avons besoin de statistiques sommaires; des descripteurs numériques qui peuvent décrire efficacement et efficacement l'ensemble des données ou de la distribution sous investigation. Ces descripteurs doivent être: faciles à gérer, simples à interpréter et refléter adéquatement les tendances des données.

Typiquement, ces mesures numériques sont divisées en trois catégories: mesures de tendance centrale, mesures de dispersion et mesures de position relative.

Mesures de tendance centrale

Une façon de résumer les données est avec une mesure de tendance centrale (c'est-à-dire avec un nombre qui décrit la valeur la plus centrale ou la plus typique dans le pool de données ou la distribution de probabilité.)

Les mesures de tendance centrale sont importantes en statistique car elles nous permettent de:
  • Trouver une valeur représentative dans l'ensemble de données
  • Condenser une vaste quantité d'informations (par exemple, données et chiffres) en un seul nombre.
  • Faire des comparaisons entre deux ou plusieurs distributions en utilisant des valeurs représentatives de chacune qui décrivent ces distributions.
  • Les trois mesures de tendance centrale les plus courantes sont: moyenne, médiane et mode.

    Moyenne (Moyenne)

    Définition:

    Moyenne (Moyenne)

    La moyenne est la moyenne.

    Formule:

    Moyenne de population

    La moyenne de population, notée par $\mu$ est calculée en ajoutant toutes les valeurs de l'ensemble de données puis en divisant par le nombre de valeurs dans l'ensemble. $$\mu=\frac{\sum^n_{i=1} x_i}{N}=\frac{x_1+x_2+\cdots +x_n}{N} $$ où

    $x_i$= valeurs individuelles dans l'ensemble de données
    $N$= nombre de valeurs dans l'ensemble.

    Formule:

    Moyenne d'échantillon

    La moyenne d'échantillon, notée par $\bar{x}$ est calculée en ajoutant toutes les valeurs de l'ensemble de données puis en divisant par le nombre de valeurs dans l'ensemble. $$\overline{x}=\frac{\sum^n_{i=1} x_i}{n}=\frac{x_1+x_2+\cdots +x_n}{n} $$ où

    $x_i$= valeurs individuelles dans l'ensemble de données
    $n$= nombre de valeurs dans l'ensemble.

    Remarque

    Bien que la moyenne de population, $\mu$, et la moyenne d'échantillon, $\overline{x}$ désignent deux choses différentes, elles sont calculées de la même manière.

    Exemple 1

    Calculer la moyenne de l'échantillon de l'ensemble de données suivant: 1, 2, 3, 4, 5.

    La moyenne est calculée comme suit: $$\overline{x}=\frac{\sum^n_{i=1} x_i}{n}=\frac{1+2+3+4+5}{5}=\frac{15}{5}=3$$

    Solution

    Exemple 2

    Le professeur X vient de terminer de corriger les papiers écrits par ses étudiants sur les causes de la mutation génétique chez l'homme. Les papiers sont notés sur 100, et chacune des notes est indiquée ci-dessous. $$ \begin{array}{lllllll} 60 & 95 & 75 & 88 & 93 & 84 & 60 \\ 65 & 99 & 72 & 81 & 77 & 89 & 91\end{array}$$ Calculez la note moyenne des papiers.

    $$\overline{x}=\frac{\sum x_i}{n}=\frac{60+95+75+\cdots +91}{14}=\frac{1129}{14}=80.64$$

    Solution

    Médiane

    Définition:

    Médiane

    La médiane est la valeur médiane d'un ensemble de données.

    Formule:

    Médiane

    Pour trouver la médiane, l'ensemble de données doit d'abord être ordonné du plus petit au plus grand. Si le nombre de valeurs dans l'ensemble de données est impair, la médiane est la valeur médiane. Si le nombre de valeurs dans l'ensemble de données est pair, la médiane est la moyenne des deux valeurs médianes.

    Exemple 3

    Il y a sept sections de Probabilité et Statistiques ce semestre. L'enseignant responsable de la Section 3 du cours est détendu et patient. Le nombre de minutes qu'il faut à ses étudiants pour terminer un exercice de classe est présenté ci-dessous. $$ \begin{array}{lllllllllll} 82 & 42 & 55 & 58 & 56 & 21 & 83 & 80 & 67 & 35 & 79 \end{array}$$ Déterminez la médiane.

    En ordonnant les données par ordre croissant $$\begin{array}{lllllllllll} 21 & 35 & 42 & 55 & 56 & \mathbf{58} & 67 & 79 & 80 & 82 & 83\end{array}$$ La médiane est $58$

    Solution

    Exemple 4

    L'enseignant responsable de la Section 1 de l'Analyse des données commerciales est sur un horaire. Le temps, en minutes, que ses étudiants mettent pour terminer un exercice de classe est ci-dessous. $$ \begin{array}{llllllllll} 25 & 42 & 31 & 29 & 43 & 26 & 15 & 22 & 36 & 26\end{array}$$ Déterminez la médiane.

    En ordonnant les données par ordre croissant $$\begin{array}{llllllllll} 15 & 22 & 25 & 26 & 26 & 29 & 31 & 36 & 42 & 43\end{array}$$ La $médiane =\frac{26+29}{2}=27.5$

    Solution

    Remarque

    En présence de valeurs aberrantes (c'est-à-dire des valeurs extrêmes qui justifient un autre regard), la médiane est un meilleur indicateur de la tendance centrale que la moyenne. Cela est dû au fait que les valeurs extrêmes dans le pool de données peuvent affecter indûment la valeur de la moyenne; gonflant ou dégonflant artificiellement la moyenne en fonction de l'extrémité du spectre dans laquelle elles se trouvent. La médiane, en revanche, est résistante aux valeurs aberrantes, car sa valeur est uniquement déterminée par sa position dans l'ensemble de données et rien d'autre. L'identification des valeurs aberrantes sera abordée dans la section sur les mesures de position relative.

    Mode

    Définition:

    Mode

    La mode est la valeur qui apparaît le plus fréquemment dans un ensemble de données.
    Dans le cas où toutes les valeurs de l'ensemble de données apparaissent avec la même fréquence, l'ensemble de données est dit uniforme et n'a pas de mode. Dans le cas où deux ou plusieurs valeurs apparaissent avec la même fréquence, l'ensemble de données est dit multimodal et a plus d'un mode.

    Exemple 5

    L'enseignant responsable de la Section 2 de ce cours est connu pour être facile à vivre et permet aux étudiants de travailler en groupe. Le temps qu'il faut à ses étudiants pour terminer un exercice de classe est présenté ci-dessous $$\begin{array}{lllllllllll}22 & 23 & 23 & 27 & 27 & 27 & 27 & 27 & 31 & 35 & 36 \end{array} $$ Déterminez le mode pour cet ensemble de données

    Mode: $27$

    Solution

    Exemple 6

    L'enseignant responsable de la Section 5 de ce cours est connu pour être dur et exigeant. Le temps qu'il faut à ses étudiants pour terminer un exercice de classe est présenté ci-dessous $$\begin{array}{llllllllllllll}8 & 8 & 9 & 9 & 9 & 9 & 10 & 10 & 12 & 12 & 12 & 12 & 13 & 13 \end{array} $$ Déterminez le mode pour cet ensemble de données

    Mode: $9$ et $12$

    Solution

    Remarque

    Le mode est la seule mesure de tendance centrale qui peut être utilisée avec des données nominales. Les données nominales sont des données divisées en catégories qui n'ont pas de valeur numérique. Par exemple, les couleurs des voitures dans un parking (par exemple, rouge, bleu, vert, etc.)

    Exemple 7

    Les poids (en kg) de cinq chiens sont: $12,\, 15,\, 10,\, 20, \,$ et $18$.

    Exemple 8

    Les âges de six enfants sont: $7, \,9,\, 10,\, 8,\, 6,$ and $11$.

    Exemple 9

    Les données suivantes représentent le nombre de livres lus par des étudiants dans une classe: $3, 5, 2, 5, 3, 5, 4, 3.$

    Exemple 10

    Considérez l'ensemble de données suivant: $6,\, 6,\, 8,\, 10,\, 10,\, 10,\, 12$ quelle mesure de tendance centrale est la plus grande?

    Exemple 11

    Quelle mesure de tendance centrale est la plus appropriée pour déterminer le salaire moyen dans une entreprise où la plupart des employés gagnent entre $40 000\$$ et $60 000 \$ $, mais quelques cadres gagnent plus de $1 000 000\$ $?

    Médiane, car la moyenne serait faussée par les salaires de quelques cadres qui dépassent 1 000 000 $.

    Solution

    Exemple 12

    Quelle mesure de tendance centrale est la plus appropriée pour déterminer le nombre moyen d'enfants dans une famille?

    Mode, car le nombre d'enfants dans une famille est un nombre entier et le mode est la seule mesure de tendance centrale qui peut être utilisée avec des données nominales.

    Solution

    Moyennes Pour Tableaux de Fréquence

    Lorsque les données sont présentées sous forme de tableau de fréquence, le calcul de la moyenne doit être légèrement modifié.

    Moyennes Pour Données Non Groupées

    Formule:

    Moyenne pour Données Non Groupées

    La moyenne pour des données non groupées est obtenue en multipliant chaque valeur de $x$ par le nombre de fois qu'elle apparaît, $f$, en prenant la somme de ces produits, et en divisant par le nombre total de points de données dans l'ensemble. $$ \bar{x} = \frac{\sum_{i=1}^{n} x_i f_i}{n} $$ où

    $x_i=$ la $i^{ème}$ valeur de l'ensemble de données
    $f_i=$ la fréquence de la $i^{ème}$ valeur
    $n=$ le nombre total de points de données.

    Exemple 13

    L'année dernière, Facebook a développé et formé une IA pour concevoir des vêtements après avoir scanné des millions d'images sur Internet. Une de ses créations était un pantalon avec deux jambes supplémentaires. Les acheteurs dans un magasin de mode rapide ont été interrogés sur le montant qu'ils dépenseraient pour un tel pantalon. Leurs réponses sont présentées ci-dessous: $$\begin{array}{cc}\hline \text { Nombre d'Acheteurs } & \text { Montant (\$) } \\ \hline 13 & 5.00 \\ 27 & 8.00 \\ 24 & 10.00 \\ 31 & 15.00 \\ 15 & 20.00 \\ \hline \end{array}$$

    Remarque

    Dans l'exemple précédent, il est possible de calculer la moyenne ``à l'ancienne``, car nous pouvons récupérer le nombre de fois que chaque valeur de $x$ apparaît dans le tableau et les ét endre en une liste.

    Exemple 14

    Telegram est le système de messagerie instantanée le plus populaire de Russie. Mais parce qu'il est fortement crypté et donc complètement privé, il est utilisé par des terroristes et des trafiquants de drogue - et plus inquiétant pour le Kremlin - des opposants au régime de Poutine. Pour empêcher ses citoyens d'utiliser le système, Roskomnadzor, l'agence fédérale chargée de surveiller les communications Internet, a tenté de bloquer les adresses IP clés de Telegram. Il a échoué de manière spectaculaire. Dans leurs efforts pour fermer Telegram, ils ont également bloqué Google, MasterCard, Volvo, Nintendo, Amazon - et leur propre site Web. Pendant ce temps, les serveurs Telegram sont restés ouverts.

    L'application Telegram a été téléchargée des milliers de fois depuis l'App Store d'Apple. Le tableau ci-dessous montre comment les utilisateurs ont évalué l'application. $$ \begin{array}{|c|c|} \hline \text { Note (en étoiles) } & \text { Nombre d'Utilisateurs de Telegram } \\ \hline 5 & 1392 \\ 4 & 212 \\ 3 & 24 \\ 2 & 15 \\ 1 & 268 \\ \hline \end{array}$$

    Moyennes Pour Données Groupées

    Lorsque les données ont été préarrangées en groupes, nous ne pouvons pas ``voir`` les valeurs de données réelles pour récupérer le nombre de fois que chaque valeur apparaît. Dans ce cas, nous ne pouvons calculer qu'une moyenne approximative pour l'ensemble de données. Nous utiliserons le point médian de chaque intervalle de classe comme valeur représentative pour l'intervalle de classe.

    Formule:

    Moyenne pour Données Groupées

    La moyenne pour des données groupées est calculée en multipliant le point médian de chaque intervalle de classe, $m_i$, par la fréquence de l'intervalle de classe, $f_i$, en prenant la somme de ces produits, et en divisant par le nombre total de points de données dans l'ensemble. $$ \bar{x} = \frac{\sum_{i=1}^{n} m_i f_i}{n} $$ où

    $m_i=$ le point médian du $i^{ème}$ intervalle de classe
    $f_i=$ la fréquence de l'intervalle de classe $i^{ème}$
    $n=$ le nombre total de points de données.

    Exemple 15

    Le tableau ci-dessous montre le nombre d'heures que les étudiants passent à étudier pour un examen. $$\begin{array}{cc}\hline \text { Nombre d'Heures } & \text { Nombre d'Étudiants } \\ \hline 0-2 & 5 \\ 3-5 & 10 \\ 6-8 & 15 \\ 9-11 & 20 \\ 12-14 & 10 \\ \hline \end{array}$$

    Exemple 16

    À partir d'avril 2019, les agents de H&R Block doubleront en tant que thérapeutes. La société qui propose des services de préparation de déclarations de revenus, met maintenant tous ses professionnels de la fiscalité à travers un programme de ``formation à l'empathie`` - afin qu'ils puissent réconforter les clients mécontents de petits remboursements ou pire, surpris par une grosse facture fiscale. Le tableau montre le nombre de clients qui ont eu besoin de réconfort après avoir reçu une grosse facture fiscale. $$ \begin{array}{|c|c|} \hline \text { Montant Dû } (\$) & \text { Nombre de Clients }\\ \hline 0 \leq x<500 & 5 \\ 500 \leq x<1000 & 16 \\ 1000 \leq x<1500 & 23 \\ 1500 \leq x<2000 & 17 \\ 2000 \leq x<2500 & 14 \\ 2500 \leq x<3000 & 4 \\ \hline \end{array} $$

    Moyenne Pondérée

    Dans le calcul standard de la moyenne, chaque point de données contribue de manière égale à la valeur finale de la moyenne. Cependant, dans certains cas, nous voulons attribuer plus d'importance à l'un ou à certains des nombres qu'à d'autres. Dans des situations comme celles-ci, nous voulons calculer une moyenne pondérée.

    Formule:

    Moyenne Pondérée

    La moyenne pondérée est calculée en multipliant chaque valeur de $x$ par son poids correspondant, $w$, en prenant la somme de ces produits, et en divisant par la somme des poids. $$ \bar{x} = \frac{\sum_{i=1}^{n} x_i w_i}{\sum_{i=1}^{n} w_i} $$ où $x_i$ est la $i^{ème}$ valeur de l'ensemble de données, $w_i$ est le poids de la $i^{ème}$ valeur, et $n$ est le nombre total de points de données.

    Exemple 17

    Dans votre cours de statistiques, la note finale est basée sur plusieurs composantes: deux tests en classe, un papier et un examen final. Il y a un total de 100 points disponibles, et chaque test vaut $25 \%$ de votre note finale, le papier vaut $15 \%$, et l'examen final vaut $35 \%$. Calculez votre note finale dans ce cours si vous avez obtenu: $85 \%$ pour le test $1,70 \%$ pour le test $2,90 \%$ pour le papier, et $77 \%$ sur le final.

    La note finale dans le cours est calculée comme suit: $$\begin{aligned} \bar{x} = \frac{\sum_{i=1}^{n} x_i w_i}{\sum_{i=1}^{n} w_i} &= \frac{(85 \times 25) + (70 \times 25) + (90 \times 15) + (77 \times 35)}{25 + 25 + 15 + 35} \\ &= \frac{2125 + 1750 + 1350 + 2695}{100} \\ &= 79.20 \end{aligned}$$

    Solution

    Exemple 18

    Un biologiste de la conservation étudie la durée de vie moyenne des espèces d'oiseaux dans trois écosystèmes différents. Les écosystèmes diffèrent par le nombre d'espèces étudiées et leur durée de vie moyenne:

  • Écosystème Forestier: Durée de vie moyenne $=5$ ans; 12 espèces étudiées
  • Écosystème de Prairie: Durée de vie moyenne $=3$ ans; 8 espèces étudiées
  • Écosystème de Marais: Durée de vie moyenne $=7$ ans; 10 espèces étudiées
  • Mesures de dispersion

    Une moyenne est une tentative de résumer un ensemble de données avec un seul nombre; mais en soi, elle n'est pas significative. Pour mieux comprendre la nature des données, une référence croisée statistique qui mesure la dispersion est nécessaire. Il s'agit de: la plage, la variance, l'écart type et la plage interquartile.

    Plage

    La dispersion statistique la plus simple est la plage. Elle indique la longueur de l'intervalle couvert par les valeurs des données.

    Définition:

    Plage

    La plage d'un ensemble de données est la différence entre la plus grande et la plus petite valeur de l'ensemble.

    Formule:

    Plage

    Étant donné un ensemble de données ordonnées, $$Plage = Valeur \, la \, plus \, élevée - Valeur \, la \, plus \, basse$$

    Exemple 19

    Le travailleur moyen au Canada perd environ 2 heures par jour à surfer sur Internet, à parler à des collègues, à effectuer des tâches personnelles et à prendre de longs déjeuners. Les administrateurs ont longtemps pensé que parce qu'ils étaient mieux payés, ils travaillaient plus dur. Mais est-ce vraiment le cas? Les résultats de six administrateurs et six enseignants du département de mathématiques, ainsi que le nombre de minutes qu'ils ont passées à ne pas travailler pour diverses raisons lundi dernier, sont présentés ci-dessous.

    Administrateurs: $125,125,125,125,125,139$

    Enseignants: $9,10,13,15,22,23$

    L'un des inconvénients de l'utilisation de la plage comme mesure de dispersion est qu'elle ne fournit aucune information sur la manière dont les valeurs sont réparties entre les points de terminaison. Dans l'exemple précédent, la plage est la même pour les deux groupes, mais les ensembles de données présentent des distributions très différentes.

    Dans l'ensemble de données des administrateurs, les valeurs sont cohérentes, tandis que dans l'ensemble de données des enseignants, les valeurs ont tendance à fluctuer un peu plus. Par conséquent, les mesures qui fournissent des informations plus informatives sur la manière dont la majorité des données sont réparties sont préférées.

    Variance et écart type

    La variance et l'écart type sont deux concepts clés en statistique qui mesurent la dispersion d'un ensemble de données. Ils donnent un aperçu de la différence entre les valeurs des données et la moyenne (moyenne).

    Variance

    Définition:

    Variance

    La variance est une mesure de la différence entre les valeurs d'un ensemble de données et la moyenne. C'est la moyenne des écarts au carré par rapport à la moyenne, fournissant une représentation mathématique de la dispersion des données.

    Formule:

    Variance de la population

    Étant donné un ensemble de données avec $N$ valeurs, $x_1, x_2, x_3, ..., x_n$, la variance de la population, notée $\sigma^2$, est calculée en prenant chaque valeur de données, en soustrayant la moyenne de celle-ci, en élevant le résultat au carré, puis en moyennant les différences au carré: $$\sigma^2=\frac{\sum^n_{i=1}(x_i-\mu)^2}{N}=\frac{1}{N}\left[\sum x_i^2-\frac{\left(\sum x_i\right)^2}{N}\right]$$ où

    $\mu =$ la moyenne de la population
    $x_i =$ la $i^{ème}$ valeur de données
    $N =$ le nombre total de valeurs de données.

    Formule:

    Variance de l'échantillon

    Étant donné un ensemble de données avec $n$ valeurs, $x_1, x_2, x_3, ..., x_n$, la variance de l'échantillon, notée $s^2$, est calculée en prenant chaque valeur de données, en soustrayant la moyenne de celle-ci, en élevant le résultat au carré, puis en moyennant les différences au carré: $$s^2=\frac{\sum^n_{i=1}(x_i-\bar{x})^2}{n-1}=\frac{1}{n-1}\left[\sum x_i^2-\frac{\left(\sum x_i\right)^2}{n}\right]$$ où

    $\bar{x}=$ la moyenne de l'échantillon
    $x_i =$ la $i^{ème}$ valeur de données
    $n =$ le nombre total de valeurs de données.

    Remarque

    La formule de la variance de l'échantillon utilise $n-1$ au dénominateur au lieu de $n$ pour corriger le biais qui se produit lors de l'utilisation de la moyenne de l'échantillon pour estimer la moyenne de la population. Cette correction est connue sous le nom de correction de Bessel.
    L'un des avantages de l'utilisation de la variance comme mesure de dispersion est le fait qu'elle traite toutes les déviations par rapport à la moyenne, quelle que soit la direction. Mais en même temps, cela rend la variance sensible aux valeurs aberrantes.
    Un autre inconvénient de la variance est qu'elle n'est pas facile à interpréter. Par conséquent, l'écart type est souvent préféré comme mesure de dispersion car il est exprimé dans les mêmes unités que les données.

    Écart type

    L'écart type est la racine carrée de la variance. Il mesure la distance typique des points de données par rapport à la moyenne et est exprimé dans les mêmes unités que les données. Il donne une idée intuitive de la variabilité des données.

    Définition:

    Écart type

    L'écart type est la racine carrée de la variance. C'est une mesure de la dispersion d'un ensemble de points de données autour de la moyenne.

    Formule:

    Écart type de la population

    L'écart type de la population, noté $\sigma$, est obtenu en prenant la racine carrée de la variance de la population $$\sigma=\sqrt{\frac{\sum^n_{i=1}(x_i-\mu)^2}{N}}=\sqrt{\frac{1}{N}\left[\sum x_i^2-\frac{\left(\sum x_i\right)^2}{N}\right]}$$ où

    $\mu =$ la moyenne de la population
    $x_i =$ la $i^{ème}$ valeur de données
    $N =$ le nombre total de valeurs de données.

    Formule:

    Écart type de l'échantillon

    L'écart type de l'échantillon, noté $s$, est calculé en prenant la racine carrée de la variance de l'échantillon $$s=\sqrt{\frac{\sum^n_{i=1}(x_i-\bar{x})^2}{n-1}}=\sqrt{\frac{1}{n-1}\left[\sum x_i^2-\frac{\left(\sum x_i\right)^2}{n}\right]}$$ où

    $\bar{x}=$ la moyenne de l'échantillon
    $x_i =$ la $i^{ème}$ valeur de données
    $n =$ le nombre total de valeurs de données.
    L'écart type sert de mesure pour indiquer dans quelle mesure les données sont réparties par rapport à la moyenne.
  • Plus l'écart type est grand, plus les données sont étalées.
  • En revanche, plus l'écart type est petit, plus les points de données se regroupent autour de la moyenne.
  • Règle empirique

    Si la distribution est en forme de cloche, alors la règle empirique indique que presque toutes les données se trouvent dans trois écarts types de la moyenne. Plus précisément,

  • 68% des données se trouvent dans un écart type de la moyenne.
  • 95% des données se trouvent dans deux écarts types de la moyenne.
  • 99,7% des données se trouvent dans trois écarts types de la moyenne.
  • Exemple 20

    Capsicum Ivanovii Mathematica est une variété de piments rouges épicés originaire de Bulgarie. Un de mes collègues aime les cultiver dans son jardin, et il a soumis quelques spécimens à un concours local. Voici les longueurs des poivrons qu'il a soumis $$\begin{array}{lllllll} 30 & 35 & 42 & 45 & 36 & 43 & 28\end{array}$$

    Variance et écart type pour les distributions de fréquences

    Lorsque l'on travaille avec des distributions de fréquences, les formules de variance et d'écart type sont légèrement modifiées. Les formules sont ajustées pour tenir compte de la fréquence de chaque valeur de données.

    Variance et écart type pour les données non groupées

    Formule:

    Variance pour les distributions de fréquences (Données non groupées)

    La variance pour les données non groupées est calculée comme suit: $$s^2=\frac{\sum^n_{i=1}(x_i-\bar{x})^2 f_i}{n-1}=\frac{1}{n-1}\left[\sum f_i x_i^2-\frac{\sum f_i x_i}{n}\right]$$ où

    $f_i=$ est la fréquence de la $i^{ème}$ valeur de données
    $x_i=$ la $i^{ème}$ valeur de données
    $n=$ est le nombre total de valeurs de données.

    Remarque

    La deuxième formule pour la variance des données non groupées est plus facile à travailler; mais les deux formules sont équivalentes.

    Exemple 21

    À l'école de conduite Steer Clear, 40 étudiants viennent de terminer un examen théorique pour voir s'ils sont admissibles à un permis d'apprenti. L'examen était composé de 30 questions et chaque question valait un point. Voici les scores $$ \begin{array}{cc} \text { Score de l'examen } & \text { Nombre d'étudiants } \\ \hline 20 & 1 \\ 21 & 2 \\ 23 & 7 \\ 24 & 3 \\ 27 & 10 \\ 28 & 3 \\ 29 & 4 \\ 30 & 10 \end{array}$$

    Exemple 22

    Si une alarme régulière ne vous réveille pas à temps, que diriez-vous d'un ``dispositif pour réveiller les personnes endormies``? Breveté en 1882, l'invention était destinée à réveiller les dormeurs profonds en leur laissant tomber des blocs de bois ou de liège sur le visage à une heure fixée. L'appareil était connecté à une horloge, garantissant un réveil à l'heure, bien que surprenant.

    En fonction de la complexité de l'invention soumise à l'examen, le nombre de pages de la demande varie considérablement comme le montre le tableau ci-dessous. $$\begin{array}{cc} \text { Nombre de pages } & \text { Nombre de demandes } \\ \hline 10 & 5 \\ 12 & 15 \\ 23 & 20 \\ 45 & 25 \\ 15 & 30 \\ \hline \end{array}$$

    Variance et écart type pour les données groupées

    Lorsque l'on travaille avec des données groupées, les $x_i$ dans les formules de variance et d'écart type sont remplacés par les points médians de chaque intervalle de classe.

    Formule:

    Variance pour les distributions de fréquences (Données groupées)

    La variance pour les données groupées est calculée comme suit: $$s^2=\frac{\sum^n_{i=1}(m_i-\bar{x})^2 f_i}{n-1}=\frac{1}{n-1}\left[\sum f_i m_i^2-\frac{\left(\sum f_i m_i\right)^2}{n}\right]$$ où

    $f_i=$ est la fréquence de la $i^{ème}$ valeur de données
    $m_i=$ le point médian de la $i^{ème}$ classe
    $n=$ est le nombre total de valeurs de données.

    Exemple 23

    Il semble que les fans de Taylor Swift écouteront à peu près tout ce que la chanteuse sort. En 2014, la chanteuse a accidentellement sorti 8 secondes de bruit blanc sur iTunes au Canada et il a immédiatement grimpé en tête des charts. Intitulé simplement ``Track 3``, il se trouve sur l'album, 1989, coincé entre ``Welcome to New York`` et ``Shake It Off``.

    La version Deluxe de l'album 1989 de Taylor a 19 chansons. Voici un tableau montrant la durée de chaque chanson en secondes. $$\begin{array}{cc} \text { Durée de la chanson (s) } & \text { Nombre de chansons } \\ \hline 100 \leq x < 150 & 2 \\ 150 \leq x < 200 & 2 \\ 200\leq x<250 & 11 \\ 250\leq x<300 & 6 \end{array}$$

    Exemple 24

    Le premier enregistrement de l'utilisation du mot ``ordinateur`` remonte à 1613 pour décrire une personne qui effectuait des calculs. Le terme a ensuite été utilisé pour décrire une machine qui effectuait des calculs. Le premier ordinateur était le moteur analytique, conçu par Charles Babbage en 1837. Le moteur analytique n'a jamais été achevé, mais c'était la première machine qui pouvait être considérée comme un ordinateur.

    Le tableau ci-dessous montre le nombre d'ordinateurs vendus par un magasin d'électronique local le mois dernier. $$\begin{array}{cc} \text { Nombre d'ordinateurs vendus } & \text { Nombre de jours } \\ \hline 0 \leq x < 5 & 2 \\ 5 \leq x < 10 & 3 \\ 10\leq x<15 & 4 \\ 15\leq x<20 & 5 \end{array}$$

    Mesures de position relatives

    Les mesures de position relatives sont conçues pour fournir des informations sur l'emplacement des points de données individuels par rapport à l'ensemble des données.
    Les mesures de position relatives les plus courantes sont les percentiles, les quartiles et les z-scores (que nous couvrirons dans la section sur la distribution normale).

    Exemple

    Chaque année, des milliers d'étudiants passent l'examen SAT pour l'admission à l'université. Alice vient de marquer 1060 à l'examen, ce qui la place dans le 90e percentile. Interprétez la signification de cette déclaration.

    Cela signifie que $90 %$ des scores sont inférieurs à ce qu'Alice a reçu, et $10 %$ sont supérieurs aux siens.

    Solution

    Comment calculer les percentiles

    Formule:

    Percentile

    Étant donné un ensemble de données ordonné du plus petit au plus grand, l'emplacement du $P^{e}$ percentile est donné par la formule: $$ L = \frac{(N+1)P_{i}}{100} $$ où $N$ est le nombre de points de données dans l'ensemble de données, et $P_{i}$ est le percentile d'intérêt.

    Exemple

    Le temps mis par 33 étudiants pour terminer l'examen de probabilité et de statistiques de 2 heures est donné ci-dessous. Les temps sont arrondis à la minute la plus proche. $$\begin{array}{rrrrrrrrrrr} 80 & 80 & 80 & 81 & 82 & 85 & 88 & 90 & 91 & 91 & 93 \\ 93 & 94 & 94 & 95 & 97 & 97 & 97 & 99 & 105 & 108 & 110 \\ 110 & 110 & 112 & 113 & 113 & 116 & 116 & 117 & 118 & 119 & 120\end{array}$$ Déterminez le $30^{e}$ percentile de l'ensemble de données.

    $$ L = \frac{(N+1)P_{i}}{100} = \frac{(33+1)(30)}{100} = 10.20 $$ Le $30^{e}$ percentile est la $10.2^{e}$ valeur dans l'ensemble de données ordonné, qui est $$P_{30}=91+0.20(93-91)=91.40$$.

    Solution

    Exemple

    Considérez à nouveau le temps mis par 33 étudiants pour terminer l'examen de probabilité et de statistiques de 2 heures est donné ci-dessous. Les temps sont arrondis à la minute la plus proche. $$\begin{array}{rrrrrrrrrrr} 80 & 80 & 80 & 81 & 82 & 85 & 88 & 90 & 91 & 91 & 93 \\ 93 & 94 & 94 & 95 & 97 & 97 & 97 & 99 & 105 & 108 & 110 \\ 110 & 110 & 112 & 113 & 113 & 116 & 116 & 117 & 118 & 119 & 120\end{array}$$ Déterminez le $55^{e}$ percentile de l'ensemble de données.

    $$ L = \frac{(N+1)P_{i}}{100} = \frac{(33+1)(55)}{100} = 18.70 $$ Le $55^{e}$ percentile est la $18.7^{e}$ valeur dans l'ensemble de données ordonné, qui est $$$P_{55}=97+0.7(99-97)=98.40$$.

    Solution

    Exemple

    Le temps mis par 33 étudiants pour terminer l'examen de probabilité et de statistiques de 2 heures est donné ci-dessous. Les temps sont arrondis à la minute la plus proche. $$\begin{array}{rrrrrrrrrrr} 80 & 80 & 80 & 81 & 82 & 85 & 88 & 90 & 91 & 91 & 93 \\ 93 & 94 & 94 & 95 & 97 & 97 & 97 & 99 & 105 & 108 & 110 \\ 110 & 110 & 112 & 113 & 113 & 116 & 116 & 117 & 118 & 119 & 120\end{array}$$ Déterminez le deuxième quartile de l'ensemble de données.

    $Q_2=P_{50}$ $$L=\frac{(N+1)P_{50}}{100}=\frac{(33+1)50}{100}= 17 \quad \Rightarrow \quad Q_2=97$$.

    Solution

    Valeurs aberrantes

    Les valeurs aberrantes sont des points de données qui sont significativement différents du reste de l'ensemble de données. Ils peuvent avoir un impact important sur les mesures de tendance centrale et de dispersion. Les valeurs aberrantes peuvent être identifiées à l'aide de la formule suivante qui utilise l'écart interquartile:

    Formule:

    Écart interquartile (IQR)

    Soit $Q_1$ le premier quartile et $Q_3$ le troisième quartile. L'écart interquartile est donné par la formule: $$IQR=Q_3-Q_1$$.

    Formule:

    Valeurs aberrantes

    Une observation est considérée comme une valeur aberrante si elle est inférieure à $Q_1-1.5(Q_3-Q_1)$ ou supérieure à $Q_3+1.5(Q_3-Q_1)$.

    Exemple

    Le temps mis par 33 étudiants pour terminer l'examen de probabilité et de statistiques de 2 heures est donné ci-dessous. Les temps sont arrondis à la minute la plus proche. $$\begin{array}{rrrrrrrrrrr} 80 & 80 & 80 & 81 & 82 & 85 & 88 & 90 & 91 & 91 & 93 \\ 93 & 94 & 94 & 95 & 97 & 97 & 97 & 99 & 105 & 108 & 110 \\ 110 & 110 & 112 & 113 & 113 & 116 & 116 & 117 & 118 & 119 & 120\end{array}$$ Déterminez s'il y a des valeurs aberrantes dans l'ensemble de données.

    $Q_1=88$ et $Q_3=116$. $$Q_1-1.5(Q_3-Q_1)=88-1.5(116-88)=58$$ $$Q_3+1.5(Q_3-Q_1)=116+1.5(116-88)=146$$ Il n'y a pas de valeurs aberrantes dans l'ensemble de données.

    Solution

    Exemple

    L'argent ne peut pas vous acheter l'amour, mais s'habiller bien aide certainement. Selon une enquête récente, $85 \%$ des femmes ont déclaré qu'un homme bien habillé était bien plus attrayant qu'un homme riche . L'enquête a également révélé que pour $63 \%$ des participants, bien habillé était synonyme de bien taillé. Un échantillon aléatoire de 30 hommes d'affaires a été interrogé sur le coût du costume qu'ils portaient. Leurs réponses sont présentées ci-dessous. $$\begin{array}{rrrrrrrrrrrrrrr} 90 & 90 & 92 & 92 & 93 & 96 & 96 & 99 & 100 & 101 & 102 & 106 & 108 & 109 & 112 \\ 113 & 113 & 113 & 114 & 115 & 116 & 117 & 117 & 117 & 118 & 119 & 119 & 119 & 120 & 150 \end{array}$$

    Exemple

    Le président russe, Vladimir Poutine, pourrait être prêt à plaisanter sur des choses comme le changement climatique et l'ingérence dans les élections américaines, mais quand il s'agit de sa masculinité, il ne plaisante pas. Le président de 72 ans, qui aime être photographié torse nu et tenant de grosses armes, a récemment déclaré dans une interview qu'il n'avait pas de ``mauvais jours en tant que président`` parce qu'``il n'est pas une femme`` et a offert cette explication pseudoscientifique sur la raison pour laquelle c'était le cas : ``Je ne cherche à insulter personne. C'est juste la nature des choses. Il y a certains cycles naturels``. Plusieurs hommes et femmes ont été interrogés sur le nombre de mauvais jours qu'ils ont vécus au travail. Leurs réponses sont indiquées ci-dessous :

    Hommes $$\begin{array}{llllllllllll} 13 & 15 & 15 & 15 & 17 & 18 & 19 & 19 & 19 & 20 & 21 & 22 \\ 24 & 24 & 26 & 27 & 28 & 28 & 32 & 33 & 33 & 34 & 55 \end{array}$$
    Femmes $$\begin{array}{rrrrrrrrrrrrrr}2 & 6 & 7 & 10 & 12 & 12 & 12 & 13 & 14 & 17 & 17 & 18 & 19 & 20 \\ 21 & 22 & 23 & 23 & 26 & 28 & 29 & 29 & 30 & 31 & 34 & 39 & 54 & 59 \end{array}$$

    Exercices

    Question 1

    Expliquez la différence entre la moyenne, la médiane et le mode. Dans quel type de jeu de données la médiane est-elle une meilleure mesure de la tendance centrale que la moyenne?

    La moyenne est la moyenne de tous les nombres d'un jeu de données. La médiane est le nombre du milieu dans un jeu de données lorsque les nombres sont classés par ordre. Le mode est le nombre qui apparaît le plus fréquemment dans un jeu de données. La médiane est une meilleure mesure de la tendance centrale que la moyenne lorsque le jeu de données contient des valeurs aberrantes, ou des valeurs extrêmes, qui fausseraient la moyenne.

    Solution

    Question 2

    Définissez la plage et l'écart type. Comment ces deux mesures fournissent-elles des informations différentes sur la dispersion des données?

    La plage d'un jeu de données est la différence entre les valeurs maximale et minimale du jeu de données. Elle fournit une mesure simple de la dispersion des données. L'écart type est une mesure plus sophistiquée de la dispersion des données, prenant en compte la variance des points de données par rapport à la moyenne.

    Solution

    Question 3

    Quand utiliseriez-vous un percentile pour décrire un jeu de données au lieu de la moyenne ou de la médiane?

    Vous utiliseriez un percentile pour décrire un jeu de données lorsque vous voulez connaître le pourcentage de points de données qui tombent en dessous d'une certaine valeur dans le jeu de données. Cela peut être utile pour comparer des points de données individuels au reste du jeu de données.

    Solution

    Question 4

    Quelle est la règle empirique, et comment peut-elle aider à interpréter des données qui suivent une distribution normale?

    La règle empirique stipule que pour un jeu de données qui suit une distribution normale, environ 68 % des points de données tombent dans un écart type de la moyenne, 95 % tombent dans deux écarts types, et 99,7 % tombent dans trois écarts types. Cette règle peut aider à interpréter les données en fournissant une estimation rapide de la dispersion des données.

    Solution

    Question 5

    Les notes d'un groupe d'élèves sont fortement asymétriques vers la gauche. Quelle mesure de la tendance centrale est la plus appropriée pour décrire les données, et pourquoi?

    Lorsque les données sont fortement asymétriques vers la gauche, la médiane est la mesure de la tendance centrale la plus appropriée pour décrire les données. Cela est dû au fait que la médiane n'est pas affectée par les valeurs extrêmes ou les valeurs aberrantes, qui peuvent fausser la moyenne.

    Solution

    Question 6

    Les notes d'un groupe d'élèves sont fortement asymétriques vers la droite. Classez les trois mesures de la tendance centrale, la moyenne, la médiane et le mode du plus petit au plus grand.

    Lorsqu'un jeu de données est fortement asymétrique vers la droite : la moyenne est tirée vers la queue supérieure (droite) car elle est influencée par les valeurs extrêmes ; la médiane est moins affectée par les valeurs extrêmes mais se déplace légèrement vers la queue par rapport au mode ; le mode est situé au sommet de la distribution, qui est du côté gauche des données. Ordre du plus petit au plus grand : Mode < Médiane < Moyenne.

    Solution

    Question 7

    Si un jeu de données contient des valeurs aberrantes, quelle mesure de dispersion - la plage ou l'écart interquartile (IQR) - serait plus appropriée, et pourquoi?

    Si un jeu de données contient des valeurs aberrantes, l'écart interquartile (IQR) serait plus approprié que la plage comme mesure de dispersion. L'IQR est moins sensible aux valeurs aberrantes car il est basé sur les 50 % du milieu des données, ce qui le rend plus robuste aux valeurs extrêmes.

    Solution

    Question 8

    Un jeu de données suit une distribution normale avec une moyenne de 50 et un écart type de 5. Selon la règle empirique, quel pourcentage de données se situe entre 40 et 60?

    Selon la règle empirique, environ 68 % des données se situent dans un écart type de la moyenne. Par conséquent, environ 68 % des données se situent entre 40 et 60 dans ce jeu de données.

    Solution

    Question 9

    Décrivez une situation où la variance serait plus utile que l'écart type pour comparer deux jeux de données.

    La variance serait plus utile que l'écart type pour comparer deux jeux de données lorsque vous voulez comparer la dispersion des données par rapport à la moyenne. La variance fournit une mesure de l'écart quadratique moyen des points de données par rapport à la moyenne, ce qui peut être utile pour comprendre la variabilité globale des données.

    Solution

    Question 10

    Les notes d'un groupe d'élèves sont fortement asymétriques vers la droite. Classez les trois mesures de la tendance centrale, la moyenne, la médiane et le mode du plus petit au plus grand.

    Lorsqu'un jeu de données est fortement asymétrique vers la gauche : la moyenne est tirée vers la queue inférieure (gauche) car elle est affectée par les valeurs extrêmes ; la médiane est moins influencée par l'asymétrie par rapport à la moyenne mais se déplace légèrement vers la gauche ; le mode est situé au sommet de la distribution, qui est du côté droit des données. Ordre du plus petit au plus grand : Moyenne < Médiane < Mode.

    Solution

    Question 11

    Suite au mouvement #MeToo, Netflix a mis en place une ``règle des cinq secondes`` sur ses plateaux - non pour la nourriture tombée, mais pour le contact visuel. Les acteurs et l'équipe ont reçu pour consigne de ne pas se fixer du regard pendant plus de cinq secondes, une politique inspirée par la découverte que les regards prolongés sont officiellement ``flippants.`` La règle, ainsi que les interdictions de câlins, de flirt et de demandes de numéros de téléphone, sont intervenues après le scandale de comportement de Kevin Spacey, qui a coûté des millions à Netflix et ralenti la production de House of Cards.

    Sur les plateaux de The Crown, Stranger Things et Orange is the New Black, les membres de la distribution et de l'équipe ont été interrogés : ``Combien de secondes de contact visuel soutenu considérez-vous comme flippant?`` Leurs réponses sont résumées dans le tableau ci-dessous: $$\begin{array}{cc}\\ \text { Nombre de secondes } & \text { Nombre de personnes } \\ \hline 5 & 17 \\ 7 & 23 \\ 9 & 36 \\ 10 & 44 \\ 11 & 12 \\ 15 & 3 \\ \hline \end{array}$$

    Question 12

    Le Bois de Vincennes, un parc de 2 000 acres dans le 12e arrondissement de Paris, est le plus grand parc public de la ville - et l'un des plus révélateurs. Certaines zones sont réservées aux naturistes, qui, l'été dernier, ont dû appeler des renforts après que leur frétillante et paisible nudité ait été perturbée par des voyeurs et des exhibitionnistes. Naturellement, la police française a renforcé les patrouilles pour protéger la sacralité de l'expériencenue. Le tableau ci-dessous montre combien de minutes plusieurs nudistes ont réussi à profiter du Bois de Vincennes vendredi dernier avant, vraisemblablement, de se mettre à l'abri.

    $$\begin{array}{c|c} \text { Temps (en min.) } & \text { Nombre de Nudistes } \\ \hline [0,60) & 15 \\ [60,120) & 50 \\ [120,180) & 65 \\ [180,240) & 155 \\ [240,300) & 70 \\ [300,360) & 45 \\ [360,420) & 5 \\ \hline \end{array}$$

    Question 13

    Pour le doublage allemand de The Terminator, Arnold Schwarzenegger n'a pas été autorisé à se doubler lui-même car son accent était jugé trop rural - apparemment, même les robots tueurs ont des normes linguistiques. Les producteurs ont pensé qu'il serait difficile de prendre au sérieux une machine de mort futuriste si elle sonnait comme un plouc. Sur Twitter, cependant, Arnold s'appuie sur son héritage inarrêtable. Avec 4,26 millions de followers, sa bio se lit comme suit : ``Former Mr. Olympia, Conan, Terminator, and Governor of California. I killed the Predator. I told you I'd be back.`` Clairement, aucun accent ne peut arrêter le Terminator en ligne.

    Voici les durées de plusieurs des films les plus remarquables d'Arnie. $$\begin{array}{lc} \text { Film } & \text { Durée (minutes) } \\ \hline \text { Conan le Barbare } & 129 \\ \text { Conan le Destructeur } & 101 \\ \text { Terminator } & 107 \\ \text { Predator } & 107 \\ \text { Terminator 2 : Le Jugement dernier } & 137 \\ \text { Terminator 3 : Le Soulèvement des machines } & 109 \\ \hline \end{array} $$

    Question 14

    En mars dernier, le Brighton's Big Cheese Festival a rencontré un problème plutôt ironique - il est tombé à court de fromage. Le mauvais temps a retardé plusieurs commerçants, laissant des centaines de participants à regarder des tables vides et à remettre en question leurs choix de vie. Un visiteur peu impressionné a pris la parole sur les réseaux sociaux pour écrire : ``Hmm, je m'attendais à plus de fromage,`` tandis qu'un autre a plaisanté : ``J'aurais dû aller au supermarché - moins de files d'attente et beaucoup plus de fromage.``

    Le tableau ci-dessous montre le nombre de fromages échantillonnés par les participants au festival. $$\begin{array}{|c|c|} \text { Nombre de Fromages Échantillonnés } & \text { Nombre de Participants } \\ \hline 0-5 & 20 \\ 6-10 & 35 \\ 11-15 & 50 \\ 16-20 & 45 \\ 21-25 & 30 \\ 26-30 & 15 \\ 31-35 & 5 \\ \hline \end{array}$$

    Question 15

    Les parents suisses qui ont un sens de l'humour tordu peuvent désormais engager un « clown d'anniversaire diabolique » pour traquer et harceler leurs enfants jusqu'à une semaine avant leur anniversaire ${ }^{12}$. Dominic Deville dit avoir eu l'idée de se déguiser en clown effrayant et d'effrayer des enfants sans méfiance après avoir lu It de Stephen King et regardé Killer Clowns From Outer Space (Les clowns tueurs de l'espace). Il s'est également empressé de préciser que cet « amusement » pouvait être annulé à tout moment, ce qui est une bonne chose pour les parents qui ont des doutes sur ce service ou qui n'ont pas économisé suffisamment d'argent pour des séances de thérapie.

    Les tarifs horaires pour 10 clowns d'anniversaire maléfiques sont indiqués ci-dessous: $$\begin{array}{ccccc} 40 & 40 & 45 & 45 & 65\\ 65 & 70 & 70 & 75 & 80\ \end{array}$$

    Question 16

    Uber se retrouve au cœur d'un divorce compliqué et potentiellement très coûteux. Un Français poursuit le géant du covoiturage pour 45 millions d'euros après qu'un bug dans l'application a alerté sa femme sur ses activités extraconjugales. Selon l'homme d'affaires anonyme, même après s'être déconnecté, l'application a continué à envoyer des notifications sur le téléphone de sa femme, détaillant les dates, heures et lieux de ses escapades romantiques. Le résultat ? Elle l'a poursuivi en divorce, et il s'est retourné contre Uber pour ne pas avoir protégé sa vie privée, car apparemment, la discrétion a un coût supplémentaire. Les utilisateurs d'Android peuvent cependant se détendre, le bug n'a mis en évidence que les utilisateurs d'iPhone.

    Après que la nouvelle du bug a fait la une des journaux, Uber a créé une mise à jour pour l'application défectueuse. Le nombre de secondes qu'il a fallu aux utilisateurs d'iPhone pour télécharger et installer la mise à jour sur leurs téléphones est indiqué dans les données ci-dessous. \begin{array}{llllllllllllllll} 15 & 16 & 17 & 17 & 17 & 18 & 18 & 19 & 19 & 20 & 23 & 23 & 23 & 23 & 23 & 24 \\ 25 & 25 & 25 & 25 & 26 & 27 & 28 & 28 & 29 & 29 & 29 & 30 & 30 & 30 & 30 & 33 \\ 33 & 33 & 34 & 34 & 34 & 34 & 34 & 35 & 36 & 36 & 37 & 37 & 37 & 40 & 40 & 41 \\ 42 & 44 & 44 & 45 & 45 & 45 & 47 & 47 & 47 & 47 & 50 & 51 & 51 & 53 & 54 & 57 \end{array}

    Question 17

    Peppa Pig, le cadeau britannique aux enfants d'âge préscolaire, a paniqué certains parents américains après que leurs enfants ont commencé à parler avec un accent britannique et à dire « biscuits » au lieu de « cookies ». Les psychologues assurent à tout le monde que l'effet Peppa est temporaire, même s'il peut donner à l'heure du goûter une allure étrangement formelle. Quelqu'un veut du thé ?

    Les données ci-dessous montrent le nombre d'heures qu'un groupe d'enfants a passé à regarder Peppa Pig l'année dernière. $$\begin{array}{|c|c|} \text { Nombre d'heures } & \text { Nombre d'enfants } \\ \hline 0-2 & 10 \\ 3-5 & 15 \\ 6-8 & 20 \\ 9-11 & 25 \\ 12-14 & 30 \\ 15-17 & 25 \\ 18-20 & 15 \\ \hline \end{array}$$

    Question 18

    En 2021, American Airlines a décidé de sévir contre les animaux de soutien émotionnel. Les chèvres, les serpents, les araignées et tout ce qui a des sabots, des défenses ou des cornes ont été officiellement interdits de vol, car rien ne dit mieux « vol relaxant » qu'une chèvre essayant de s'emparer du siège côté couloir. Les oiseaux non domestiques ont été ajoutés à la liste des animaux interdits, au grand désespoir d'une femme qui a été refoulée avec son paon de soutien émotionnel.

    Les chiens de soutien émotionnel sont toujours autorisés sur les vols, mais ils doivent désormais voyager en soute. Les données ci-dessous montrent le poids de 32 chiens de soutien émotionnel qui ont été autorisés à voler le mois dernier.

    $$\begin{array}{llllllllllllllll} 10 & 10 & 15 & 15 & 20 & 20 & 25 & 25 & 30 & 30 & 35 & 35 & 40 & 40 & 45 & 45 \\ 50 & 50 & 55 & 55 & 60 & 60 & 65 & 65 & 70 & 70 & 75 & 75 & 80 & 80 & 85 & 85 \end{array}$$