Mesures numériques des données
Typiquement, ces mesures numériques sont divisées en trois catégories: mesures de tendance centrale, mesures de dispersion et mesures de position relative.
Mesures de tendance centrale
Les mesures de tendance centrale sont importantes en statistique car elles nous permettent de:
Moyenne (Moyenne)
Définition:
Moyenne (Moyenne)
Formule:
Moyenne de population
$x_i$= valeurs individuelles dans l'ensemble de données
$N$= nombre de valeurs dans l'ensemble.
Formule:
Moyenne d'échantillon
$x_i$= valeurs individuelles dans l'ensemble de données
$n$= nombre de valeurs dans l'ensemble.
Remarque
Exemple 1
Calculer la moyenne de l'échantillon de l'ensemble de données suivant: 1, 2, 3, 4, 5.
La moyenne est calculée comme suit: $$\overline{x}=\frac{\sum^n_{i=1} x_i}{n}=\frac{1+2+3+4+5}{5}=\frac{15}{5}=3$$
Solution
Exemple 2
Le professeur X vient de terminer de corriger les papiers écrits par ses étudiants sur les causes de la mutation génétique chez l'homme. Les papiers sont notés sur 100, et chacune des notes est indiquée ci-dessous. $$ \begin{array}{lllllll} 60 & 95 & 75 & 88 & 93 & 84 & 60 \\ 65 & 99 & 72 & 81 & 77 & 89 & 91\end{array}$$ Calculez la note moyenne des papiers.
$$\overline{x}=\frac{\sum x_i}{n}=\frac{60+95+75+\cdots +91}{14}=\frac{1129}{14}=80.64$$
Solution
Médiane
Définition:
Médiane
Formule:
Médiane
Exemple 3
Il y a sept sections de Probabilité et Statistiques ce semestre. L'enseignant responsable de la Section 3 du cours est détendu et patient. Le nombre de minutes qu'il faut à ses étudiants pour terminer un exercice de classe est présenté ci-dessous. $$ \begin{array}{lllllllllll} 82 & 42 & 55 & 58 & 56 & 21 & 83 & 80 & 67 & 35 & 79 \end{array}$$ Déterminez la médiane.
En ordonnant les données par ordre croissant $$\begin{array}{lllllllllll} 21 & 35 & 42 & 55 & 56 & \mathbf{58} & 67 & 79 & 80 & 82 & 83\end{array}$$ La médiane est $58$
Solution
Exemple 4
L'enseignant responsable de la Section 1 de l'Analyse des données commerciales est sur un horaire. Le temps, en minutes, que ses étudiants mettent pour terminer un exercice de classe est ci-dessous. $$ \begin{array}{llllllllll} 25 & 42 & 31 & 29 & 43 & 26 & 15 & 22 & 36 & 26\end{array}$$ Déterminez la médiane.
En ordonnant les données par ordre croissant $$\begin{array}{llllllllll} 15 & 22 & 25 & 26 & 26 & 29 & 31 & 36 & 42 & 43\end{array}$$ La $médiane =\frac{26+29}{2}=27.5$
Solution
Remarque
Mode
Définition:
Mode
Exemple 5
L'enseignant responsable de la Section 2 de ce cours est connu pour être facile à vivre et permet aux étudiants de travailler en groupe. Le temps qu'il faut à ses étudiants pour terminer un exercice de classe est présenté ci-dessous $$\begin{array}{lllllllllll}22 & 23 & 23 & 27 & 27 & 27 & 27 & 27 & 31 & 35 & 36 \end{array} $$ Déterminez le mode pour cet ensemble de données
Mode: $27$
Solution
Exemple 6
L'enseignant responsable de la Section 5 de ce cours est connu pour être dur et exigeant. Le temps qu'il faut à ses étudiants pour terminer un exercice de classe est présenté ci-dessous $$\begin{array}{llllllllllllll}8 & 8 & 9 & 9 & 9 & 9 & 10 & 10 & 12 & 12 & 12 & 12 & 13 & 13 \end{array} $$ Déterminez le mode pour cet ensemble de données
Mode: $9$ et $12$
Solution
Remarque
Exemple 7
Les poids (en kg) de cinq chiens sont: $12,\, 15,\, 10,\, 20, \,$ et $18$.
Exemple 8
Les âges de six enfants sont: $7, \,9,\, 10,\, 8,\, 6,$ and $11$.
Exemple 9
Les données suivantes représentent le nombre de livres lus par des étudiants dans une classe: $3, 5, 2, 5, 3, 5, 4, 3.$
Exemple 10
Considérez l'ensemble de données suivant: $6,\, 6,\, 8,\, 10,\, 10,\, 10,\, 12$ quelle mesure de tendance centrale est la plus grande?
Exemple 11
Quelle mesure de tendance centrale est la plus appropriée pour déterminer le salaire moyen dans une entreprise où la plupart des employés gagnent entre $40 000\$$ et $60 000 \$ $, mais quelques cadres gagnent plus de $1 000 000\$ $?
Médiane, car la moyenne serait faussée par les salaires de quelques cadres qui dépassent 1 000 000 $.
Solution
Exemple 12
Quelle mesure de tendance centrale est la plus appropriée pour déterminer le nombre moyen d'enfants dans une famille?
Mode, car le nombre d'enfants dans une famille est un nombre entier et le mode est la seule mesure de tendance centrale qui peut être utilisée avec des données nominales.
Solution
Moyennes Pour Tableaux de Fréquence
Moyennes Pour Données Non Groupées
Formule:
Moyenne pour Données Non Groupées
$x_i=$ la $i^{ème}$ valeur de l'ensemble de données
$f_i=$ la fréquence de la $i^{ème}$ valeur
$n=$ le nombre total de points de données.
Exemple 13
L'année dernière, Facebook a développé et formé une IA pour concevoir des vêtements après avoir scanné des millions d'images sur Internet. Une de ses créations était un pantalon avec deux jambes supplémentaires. Les acheteurs dans un magasin de mode rapide ont été interrogés sur le montant qu'ils dépenseraient pour un tel pantalon. Leurs réponses sont présentées ci-dessous: $$\begin{array}{cc}\hline \text { Nombre d'Acheteurs } & \text { Montant (\$) } \\ \hline 13 & 5.00 \\ 27 & 8.00 \\ 24 & 10.00 \\ 31 & 15.00 \\ 15 & 20.00 \\ \hline \end{array}$$
Remarque
Exemple 14
Telegram est le système de messagerie instantanée le plus populaire de Russie. Mais parce qu'il est fortement crypté et donc complètement privé, il est utilisé par des terroristes et des trafiquants de drogue - et plus inquiétant pour le Kremlin - des opposants au régime de Poutine. Pour empêcher ses citoyens d'utiliser le système, Roskomnadzor, l'agence fédérale chargée de surveiller les communications Internet, a tenté de bloquer les adresses IP clés de Telegram. Il a échoué de manière spectaculaire. Dans leurs efforts pour fermer Telegram, ils ont également bloqué Google, MasterCard, Volvo, Nintendo, Amazon - et leur propre site Web. Pendant ce temps, les serveurs Telegram sont restés ouverts.
L'application Telegram a été téléchargée des milliers de fois depuis l'App Store d'Apple. Le tableau ci-dessous montre comment les utilisateurs ont évalué l'application. $$ \begin{array}{|c|c|} \hline \text { Note (en étoiles) } & \text { Nombre d'Utilisateurs de Telegram } \\ \hline 5 & 1392 \\ 4 & 212 \\ 3 & 24 \\ 2 & 15 \\ 1 & 268 \\ \hline \end{array}$$
Moyennes Pour Données Groupées
Formule:
Moyenne pour Données Groupées
$m_i=$ le point médian du $i^{ème}$ intervalle de classe
$f_i=$ la fréquence de l'intervalle de classe $i^{ème}$
$n=$ le nombre total de points de données.
Exemple 15
Le tableau ci-dessous montre le nombre d'heures que les étudiants passent à étudier pour un examen. $$\begin{array}{cc}\hline \text { Nombre d'Heures } & \text { Nombre d'Étudiants } \\ \hline 0-2 & 5 \\ 3-5 & 10 \\ 6-8 & 15 \\ 9-11 & 20 \\ 12-14 & 10 \\ \hline \end{array}$$
Exemple 16
À partir d'avril 2019, les agents de H&R Block doubleront en tant que thérapeutes. La société qui propose des services de préparation de déclarations de revenus, met maintenant tous ses professionnels de la fiscalité à travers un programme de ``formation à l'empathie`` - afin qu'ils puissent réconforter les clients mécontents de petits remboursements ou pire, surpris par une grosse facture fiscale. Le tableau montre le nombre de clients qui ont eu besoin de réconfort après avoir reçu une grosse facture fiscale. $$ \begin{array}{|c|c|} \hline \text { Montant Dû } (\$) & \text { Nombre de Clients }\\ \hline 0 \leq x<500 & 5 \\ 500 \leq x<1000 & 16 \\ 1000 \leq x<1500 & 23 \\ 1500 \leq x<2000 & 17 \\ 2000 \leq x<2500 & 14 \\ 2500 \leq x<3000 & 4 \\ \hline \end{array} $$
Moyenne Pondérée
Formule:
Moyenne Pondérée
Exemple 17
Dans votre cours de statistiques, la note finale est basée sur plusieurs composantes: deux tests en classe, un papier et un examen final. Il y a un total de 100 points disponibles, et chaque test vaut $25 \%$ de votre note finale, le papier vaut $15 \%$, et l'examen final vaut $35 \%$. Calculez votre note finale dans ce cours si vous avez obtenu: $85 \%$ pour le test $1,70 \%$ pour le test $2,90 \%$ pour le papier, et $77 \%$ sur le final.
La note finale dans le cours est calculée comme suit: $$\begin{aligned} \bar{x} = \frac{\sum_{i=1}^{n} x_i w_i}{\sum_{i=1}^{n} w_i} &= \frac{(85 \times 25) + (70 \times 25) + (90 \times 15) + (77 \times 35)}{25 + 25 + 15 + 35} \\ &= \frac{2125 + 1750 + 1350 + 2695}{100} \\ &= 79.20 \end{aligned}$$
Solution
Exemple 18
Un biologiste de la conservation étudie la durée de vie moyenne des espèces d'oiseaux dans trois écosystèmes différents. Les écosystèmes diffèrent par le nombre d'espèces étudiées et leur durée de vie moyenne:
Mesures de dispersion
Plage
Définition:
Plage
Formule:
Plage
Exemple 19
Le travailleur moyen au Canada perd environ 2 heures par jour à surfer sur Internet, à parler à des collègues, à effectuer des tâches personnelles et à prendre de longs déjeuners. Les administrateurs ont longtemps pensé que parce qu'ils étaient mieux payés, ils travaillaient plus dur. Mais est-ce vraiment le cas? Les résultats de six administrateurs et six enseignants du département de mathématiques, ainsi que le nombre de minutes qu'ils ont passées à ne pas travailler pour diverses raisons lundi dernier, sont présentés ci-dessous.
Administrateurs: $125,125,125,125,125,139$
Enseignants: $9,10,13,15,22,23$
Dans l'ensemble de données des administrateurs, les valeurs sont cohérentes, tandis que dans l'ensemble de données des enseignants, les valeurs ont tendance à fluctuer un peu plus. Par conséquent, les mesures qui fournissent des informations plus informatives sur la manière dont la majorité des données sont réparties sont préférées.
Variance et écart type
Variance
Définition:
Variance
Formule:
Variance de la population
$\mu =$ la moyenne de la population
$x_i =$ la $i^{ème}$ valeur de données
$N =$ le nombre total de valeurs de données.
Formule:
Variance de l'échantillon
$\bar{x}=$ la moyenne de l'échantillon
$x_i =$ la $i^{ème}$ valeur de données
$n =$ le nombre total de valeurs de données.
Remarque
Écart type
Définition:
Écart type
Formule:
Écart type de la population
$\mu =$ la moyenne de la population
$x_i =$ la $i^{ème}$ valeur de données
$N =$ le nombre total de valeurs de données.
Formule:
Écart type de l'échantillon
$\bar{x}=$ la moyenne de l'échantillon
$x_i =$ la $i^{ème}$ valeur de données
$n =$ le nombre total de valeurs de données.
Règle empirique
Exemple 20
Capsicum Ivanovii Mathematica est une variété de piments rouges épicés originaire de Bulgarie. Un de mes collègues aime les cultiver dans son jardin, et il a soumis quelques spécimens à un concours local. Voici les longueurs des poivrons qu'il a soumis $$\begin{array}{lllllll} 30 & 35 & 42 & 45 & 36 & 43 & 28\end{array}$$
Variance et écart type pour les distributions de fréquences
Variance et écart type pour les données non groupées
Formule:
Variance pour les distributions de fréquences (Données non groupées)
$f_i=$ est la fréquence de la $i^{ème}$ valeur de données
$x_i=$ la $i^{ème}$ valeur de données
$n=$ est le nombre total de valeurs de données.
Remarque
Exemple 21
À l'école de conduite Steer Clear, 40 étudiants viennent de terminer un examen théorique pour voir s'ils sont admissibles à un permis d'apprenti. L'examen était composé de 30 questions et chaque question valait un point. Voici les scores $$ \begin{array}{cc} \text { Score de l'examen } & \text { Nombre d'étudiants } \\ \hline 20 & 1 \\ 21 & 2 \\ 23 & 7 \\ 24 & 3 \\ 27 & 10 \\ 28 & 3 \\ 29 & 4 \\ 30 & 10 \end{array}$$
Exemple 22
Si une alarme régulière ne vous réveille pas à temps, que diriez-vous d'un ``dispositif pour réveiller les personnes endormies``? Breveté en 1882, l'invention était destinée à réveiller les dormeurs profonds en leur laissant tomber des blocs de bois ou de liège sur le visage à une heure fixée. L'appareil était connecté à une horloge, garantissant un réveil à l'heure, bien que surprenant.
En fonction de la complexité de l'invention soumise à l'examen, le nombre de pages de la demande varie considérablement comme le montre le tableau ci-dessous. $$\begin{array}{cc} \text { Nombre de pages } & \text { Nombre de demandes } \\ \hline 10 & 5 \\ 12 & 15 \\ 23 & 20 \\ 45 & 25 \\ 15 & 30 \\ \hline \end{array}$$
Variance et écart type pour les données groupées
Formule:
Variance pour les distributions de fréquences (Données groupées)
$f_i=$ est la fréquence de la $i^{ème}$ valeur de données
$m_i=$ le point médian de la $i^{ème}$ classe
$n=$ est le nombre total de valeurs de données.
Exemple 23
Il semble que les fans de Taylor Swift écouteront à peu près tout ce que la chanteuse sort. En 2014, la chanteuse a accidentellement sorti 8 secondes de bruit blanc sur iTunes au Canada et il a immédiatement grimpé en tête des charts. Intitulé simplement ``Track 3``, il se trouve sur l'album, 1989, coincé entre ``Welcome to New York`` et ``Shake It Off``.
La version Deluxe de l'album 1989 de Taylor a 19 chansons. Voici un tableau montrant la durée de chaque chanson en secondes. $$\begin{array}{cc} \text { Durée de la chanson (s) } & \text { Nombre de chansons } \\ \hline 100 \leq x < 150 & 2 \\ 150 \leq x < 200 & 2 \\ 200\leq x<250 & 11 \\ 250\leq x<300 & 6 \end{array}$$
Exemple 24
Le premier enregistrement de l'utilisation du mot ``ordinateur`` remonte à 1613 pour décrire une personne qui effectuait des calculs. Le terme a ensuite été utilisé pour décrire une machine qui effectuait des calculs. Le premier ordinateur était le moteur analytique, conçu par Charles Babbage en 1837. Le moteur analytique n'a jamais été achevé, mais c'était la première machine qui pouvait être considérée comme un ordinateur.
Le tableau ci-dessous montre le nombre d'ordinateurs vendus par un magasin d'électronique local le mois dernier. $$\begin{array}{cc} \text { Nombre d'ordinateurs vendus } & \text { Nombre de jours } \\ \hline 0 \leq x < 5 & 2 \\ 5 \leq x < 10 & 3 \\ 10\leq x<15 & 4 \\ 15\leq x<20 & 5 \end{array}$$
Mesures de position relatives
Exemple
Chaque année, des milliers d'étudiants passent l'examen SAT pour l'admission à l'université. Alice vient de marquer 1060 à l'examen, ce qui la place dans le 90e percentile. Interprétez la signification de cette déclaration.
Cela signifie que $90 %$ des scores sont inférieurs à ce qu'Alice a reçu, et $10 %$ sont supérieurs aux siens.
Solution
Comment calculer les percentiles
Formule:
Percentile
Exemple
Le temps mis par 33 étudiants pour terminer l'examen de probabilité et de statistiques de 2 heures est donné ci-dessous. Les temps sont arrondis à la minute la plus proche. $$\begin{array}{rrrrrrrrrrr} 80 & 80 & 80 & 81 & 82 & 85 & 88 & 90 & 91 & 91 & 93 \\ 93 & 94 & 94 & 95 & 97 & 97 & 97 & 99 & 105 & 108 & 110 \\ 110 & 110 & 112 & 113 & 113 & 116 & 116 & 117 & 118 & 119 & 120\end{array}$$ Déterminez le $30^{e}$ percentile de l'ensemble de données.
$$ L = \frac{(N+1)P_{i}}{100} = \frac{(33+1)(30)}{100} = 10.20 $$ Le $30^{e}$ percentile est la $10.2^{e}$ valeur dans l'ensemble de données ordonné, qui est $$P_{30}=91+0.20(93-91)=91.40$$.
Solution
Exemple
Considérez à nouveau le temps mis par 33 étudiants pour terminer l'examen de probabilité et de statistiques de 2 heures est donné ci-dessous. Les temps sont arrondis à la minute la plus proche. $$\begin{array}{rrrrrrrrrrr} 80 & 80 & 80 & 81 & 82 & 85 & 88 & 90 & 91 & 91 & 93 \\ 93 & 94 & 94 & 95 & 97 & 97 & 97 & 99 & 105 & 108 & 110 \\ 110 & 110 & 112 & 113 & 113 & 116 & 116 & 117 & 118 & 119 & 120\end{array}$$ Déterminez le $55^{e}$ percentile de l'ensemble de données.
$$ L = \frac{(N+1)P_{i}}{100} = \frac{(33+1)(55)}{100} = 18.70 $$ Le $55^{e}$ percentile est la $18.7^{e}$ valeur dans l'ensemble de données ordonné, qui est $$$P_{55}=97+0.7(99-97)=98.40$$.
Solution
Exemple
Le temps mis par 33 étudiants pour terminer l'examen de probabilité et de statistiques de 2 heures est donné ci-dessous. Les temps sont arrondis à la minute la plus proche. $$\begin{array}{rrrrrrrrrrr} 80 & 80 & 80 & 81 & 82 & 85 & 88 & 90 & 91 & 91 & 93 \\ 93 & 94 & 94 & 95 & 97 & 97 & 97 & 99 & 105 & 108 & 110 \\ 110 & 110 & 112 & 113 & 113 & 116 & 116 & 117 & 118 & 119 & 120\end{array}$$ Déterminez le deuxième quartile de l'ensemble de données.
$Q_2=P_{50}$ $$L=\frac{(N+1)P_{50}}{100}=\frac{(33+1)50}{100}= 17 \quad \Rightarrow \quad Q_2=97$$.
Solution
Valeurs aberrantes
Formule:
Écart interquartile (IQR)
Formule:
Valeurs aberrantes
Exemple
Le temps mis par 33 étudiants pour terminer l'examen de probabilité et de statistiques de 2 heures est donné ci-dessous. Les temps sont arrondis à la minute la plus proche. $$\begin{array}{rrrrrrrrrrr} 80 & 80 & 80 & 81 & 82 & 85 & 88 & 90 & 91 & 91 & 93 \\ 93 & 94 & 94 & 95 & 97 & 97 & 97 & 99 & 105 & 108 & 110 \\ 110 & 110 & 112 & 113 & 113 & 116 & 116 & 117 & 118 & 119 & 120\end{array}$$ Déterminez s'il y a des valeurs aberrantes dans l'ensemble de données.
$Q_1=88$ et $Q_3=116$. $$Q_1-1.5(Q_3-Q_1)=88-1.5(116-88)=58$$ $$Q_3+1.5(Q_3-Q_1)=116+1.5(116-88)=146$$ Il n'y a pas de valeurs aberrantes dans l'ensemble de données.
Solution
Exemple
L'argent ne peut pas vous acheter l'amour, mais s'habiller bien aide certainement. Selon une enquête récente, $85 \%$ des femmes ont déclaré qu'un homme bien habillé était bien plus attrayant qu'un homme riche . L'enquête a également révélé que pour $63 \%$ des participants, bien habillé était synonyme de bien taillé. Un échantillon aléatoire de 30 hommes d'affaires a été interrogé sur le coût du costume qu'ils portaient. Leurs réponses sont présentées ci-dessous. $$\begin{array}{rrrrrrrrrrrrrrr} 90 & 90 & 92 & 92 & 93 & 96 & 96 & 99 & 100 & 101 & 102 & 106 & 108 & 109 & 112 \\ 113 & 113 & 113 & 114 & 115 & 116 & 117 & 117 & 117 & 118 & 119 & 119 & 119 & 120 & 150 \end{array}$$
Exemple
Le président russe, Vladimir Poutine, pourrait être prêt à plaisanter sur des choses comme le changement climatique et l'ingérence dans les élections américaines, mais quand il s'agit de sa masculinité, il ne plaisante pas. Le président de 72 ans, qui aime être photographié torse nu et tenant de grosses armes, a récemment déclaré dans une interview qu'il n'avait pas de ``mauvais jours en tant que président`` parce qu'``il n'est pas une femme`` et a offert cette explication pseudoscientifique sur la raison pour laquelle c'était le cas : ``Je ne cherche à insulter personne. C'est juste la nature des choses. Il y a certains cycles naturels``. Plusieurs hommes et femmes ont été interrogés sur le nombre de mauvais jours qu'ils ont vécus au travail. Leurs réponses sont indiquées ci-dessous :
Hommes $$\begin{array}{llllllllllll} 13 & 15 & 15 & 15 & 17 & 18 & 19 & 19 & 19 & 20 & 21 & 22 \\ 24 & 24 & 26 & 27 & 28 & 28 & 32 & 33 & 33 & 34 & 55 \end{array}$$
Femmes $$\begin{array}{rrrrrrrrrrrrrr}2 & 6 & 7 & 10 & 12 & 12 & 12 & 13 & 14 & 17 & 17 & 18 & 19 & 20 \\ 21 & 22 & 23 & 23 & 26 & 28 & 29 & 29 & 30 & 31 & 34 & 39 & 54 & 59 \end{array}$$
Exercices
Question 1
Expliquez la différence entre la moyenne, la médiane et le mode. Dans quel type de jeu de données la médiane est-elle une meilleure mesure de la tendance centrale que la moyenne?
La moyenne est la moyenne de tous les nombres d'un jeu de données. La médiane est le nombre du milieu dans un jeu de données lorsque les nombres sont classés par ordre. Le mode est le nombre qui apparaît le plus fréquemment dans un jeu de données. La médiane est une meilleure mesure de la tendance centrale que la moyenne lorsque le jeu de données contient des valeurs aberrantes, ou des valeurs extrêmes, qui fausseraient la moyenne.
Solution
Question 2
Définissez la plage et l'écart type. Comment ces deux mesures fournissent-elles des informations différentes sur la dispersion des données?
La plage d'un jeu de données est la différence entre les valeurs maximale et minimale du jeu de données. Elle fournit une mesure simple de la dispersion des données. L'écart type est une mesure plus sophistiquée de la dispersion des données, prenant en compte la variance des points de données par rapport à la moyenne.
Solution
Question 3
Quand utiliseriez-vous un percentile pour décrire un jeu de données au lieu de la moyenne ou de la médiane?
Vous utiliseriez un percentile pour décrire un jeu de données lorsque vous voulez connaître le pourcentage de points de données qui tombent en dessous d'une certaine valeur dans le jeu de données. Cela peut être utile pour comparer des points de données individuels au reste du jeu de données.
Solution
Question 4
Quelle est la règle empirique, et comment peut-elle aider à interpréter des données qui suivent une distribution normale?
La règle empirique stipule que pour un jeu de données qui suit une distribution normale, environ 68 % des points de données tombent dans un écart type de la moyenne, 95 % tombent dans deux écarts types, et 99,7 % tombent dans trois écarts types. Cette règle peut aider à interpréter les données en fournissant une estimation rapide de la dispersion des données.
Solution
Question 5
Les notes d'un groupe d'élèves sont fortement asymétriques vers la gauche. Quelle mesure de la tendance centrale est la plus appropriée pour décrire les données, et pourquoi?
Lorsque les données sont fortement asymétriques vers la gauche, la médiane est la mesure de la tendance centrale la plus appropriée pour décrire les données. Cela est dû au fait que la médiane n'est pas affectée par les valeurs extrêmes ou les valeurs aberrantes, qui peuvent fausser la moyenne.
Solution
Question 6
Les notes d'un groupe d'élèves sont fortement asymétriques vers la droite. Classez les trois mesures de la tendance centrale, la moyenne, la médiane et le mode du plus petit au plus grand.
Lorsqu'un jeu de données est fortement asymétrique vers la droite : la moyenne est tirée vers la queue supérieure (droite) car elle est influencée par les valeurs extrêmes ; la médiane est moins affectée par les valeurs extrêmes mais se déplace légèrement vers la queue par rapport au mode ; le mode est situé au sommet de la distribution, qui est du côté gauche des données. Ordre du plus petit au plus grand : Mode < Médiane < Moyenne.
Solution
Question 7
Si un jeu de données contient des valeurs aberrantes, quelle mesure de dispersion - la plage ou l'écart interquartile (IQR) - serait plus appropriée, et pourquoi?
Si un jeu de données contient des valeurs aberrantes, l'écart interquartile (IQR) serait plus approprié que la plage comme mesure de dispersion. L'IQR est moins sensible aux valeurs aberrantes car il est basé sur les 50 % du milieu des données, ce qui le rend plus robuste aux valeurs extrêmes.
Solution
Question 8
Un jeu de données suit une distribution normale avec une moyenne de 50 et un écart type de 5. Selon la règle empirique, quel pourcentage de données se situe entre 40 et 60?
Selon la règle empirique, environ 68 % des données se situent dans un écart type de la moyenne. Par conséquent, environ 68 % des données se situent entre 40 et 60 dans ce jeu de données.
Solution
Question 9
Décrivez une situation où la variance serait plus utile que l'écart type pour comparer deux jeux de données.
La variance serait plus utile que l'écart type pour comparer deux jeux de données lorsque vous voulez comparer la dispersion des données par rapport à la moyenne. La variance fournit une mesure de l'écart quadratique moyen des points de données par rapport à la moyenne, ce qui peut être utile pour comprendre la variabilité globale des données.
Solution
Question 10
Les notes d'un groupe d'élèves sont fortement asymétriques vers la droite. Classez les trois mesures de la tendance centrale, la moyenne, la médiane et le mode du plus petit au plus grand.
Lorsqu'un jeu de données est fortement asymétrique vers la gauche : la moyenne est tirée vers la queue inférieure (gauche) car elle est affectée par les valeurs extrêmes ; la médiane est moins influencée par l'asymétrie par rapport à la moyenne mais se déplace légèrement vers la gauche ; le mode est situé au sommet de la distribution, qui est du côté droit des données. Ordre du plus petit au plus grand : Moyenne < Médiane < Mode.
Solution
Question 11
Suite au mouvement #MeToo, Netflix a mis en place une ``règle des cinq secondes`` sur ses plateaux - non pour la nourriture tombée, mais pour le contact visuel. Les acteurs et l'équipe ont reçu pour consigne de ne pas se fixer du regard pendant plus de cinq secondes, une politique inspirée par la découverte que les regards prolongés sont officiellement ``flippants.`` La règle, ainsi que les interdictions de câlins, de flirt et de demandes de numéros de téléphone, sont intervenues après le scandale de comportement de Kevin Spacey, qui a coûté des millions à Netflix et ralenti la production de House of Cards.
Sur les plateaux de The Crown, Stranger Things et Orange is the New Black, les membres de la distribution et de l'équipe ont été interrogés : ``Combien de secondes de contact visuel soutenu considérez-vous comme flippant?`` Leurs réponses sont résumées dans le tableau ci-dessous: $$\begin{array}{cc}\\ \text { Nombre de secondes } & \text { Nombre de personnes } \\ \hline 5 & 17 \\ 7 & 23 \\ 9 & 36 \\ 10 & 44 \\ 11 & 12 \\ 15 & 3 \\ \hline \end{array}$$
Question 12
Le Bois de Vincennes, un parc de 2 000 acres dans le 12e arrondissement de Paris, est le plus grand parc public de la ville - et l'un des plus révélateurs. Certaines zones sont réservées aux naturistes, qui, l'été dernier, ont dû appeler des renforts après que leur frétillante et paisible nudité ait été perturbée par des voyeurs et des exhibitionnistes. Naturellement, la police française a renforcé les patrouilles pour protéger la sacralité de l'expériencenue. Le tableau ci-dessous montre combien de minutes plusieurs nudistes ont réussi à profiter du Bois de Vincennes vendredi dernier avant, vraisemblablement, de se mettre à l'abri.
$$\begin{array}{c|c} \text { Temps (en min.) } & \text { Nombre de Nudistes } \\ \hline [0,60) & 15 \\ [60,120) & 50 \\ [120,180) & 65 \\ [180,240) & 155 \\ [240,300) & 70 \\ [300,360) & 45 \\ [360,420) & 5 \\ \hline \end{array}$$
Question 13
Pour le doublage allemand de The Terminator, Arnold Schwarzenegger n'a pas été autorisé à se doubler lui-même car son accent était jugé trop rural - apparemment, même les robots tueurs ont des normes linguistiques. Les producteurs ont pensé qu'il serait difficile de prendre au sérieux une machine de mort futuriste si elle sonnait comme un plouc. Sur Twitter, cependant, Arnold s'appuie sur son héritage inarrêtable. Avec 4,26 millions de followers, sa bio se lit comme suit : ``Former Mr. Olympia, Conan, Terminator, and Governor of California. I killed the Predator. I told you I'd be back.`` Clairement, aucun accent ne peut arrêter le Terminator en ligne.
Voici les durées de plusieurs des films les plus remarquables d'Arnie. $$\begin{array}{lc} \text { Film } & \text { Durée (minutes) } \\ \hline \text { Conan le Barbare } & 129 \\ \text { Conan le Destructeur } & 101 \\ \text { Terminator } & 107 \\ \text { Predator } & 107 \\ \text { Terminator 2 : Le Jugement dernier } & 137 \\ \text { Terminator 3 : Le Soulèvement des machines } & 109 \\ \hline \end{array} $$
Question 14
En mars dernier, le Brighton's Big Cheese Festival a rencontré un problème plutôt ironique - il est tombé à court de fromage. Le mauvais temps a retardé plusieurs commerçants, laissant des centaines de participants à regarder des tables vides et à remettre en question leurs choix de vie. Un visiteur peu impressionné a pris la parole sur les réseaux sociaux pour écrire : ``Hmm, je m'attendais à plus de fromage,`` tandis qu'un autre a plaisanté : ``J'aurais dû aller au supermarché - moins de files d'attente et beaucoup plus de fromage.``
Le tableau ci-dessous montre le nombre de fromages échantillonnés par les participants au festival. $$\begin{array}{|c|c|} \text { Nombre de Fromages Échantillonnés } & \text { Nombre de Participants } \\ \hline 0-5 & 20 \\ 6-10 & 35 \\ 11-15 & 50 \\ 16-20 & 45 \\ 21-25 & 30 \\ 26-30 & 15 \\ 31-35 & 5 \\ \hline \end{array}$$
Question 15
Les parents suisses qui ont un sens de l'humour tordu peuvent désormais engager un « clown d'anniversaire diabolique » pour traquer et harceler leurs enfants jusqu'à une semaine avant leur anniversaire ${ }^{12}$. Dominic Deville dit avoir eu l'idée de se déguiser en clown effrayant et d'effrayer des enfants sans méfiance après avoir lu It de Stephen King et regardé Killer Clowns From Outer Space (Les clowns tueurs de l'espace). Il s'est également empressé de préciser que cet « amusement » pouvait être annulé à tout moment, ce qui est une bonne chose pour les parents qui ont des doutes sur ce service ou qui n'ont pas économisé suffisamment d'argent pour des séances de thérapie.
Les tarifs horaires pour 10 clowns d'anniversaire maléfiques sont indiqués ci-dessous: $$\begin{array}{ccccc} 40 & 40 & 45 & 45 & 65\\ 65 & 70 & 70 & 75 & 80\ \end{array}$$
Question 16
Uber se retrouve au cœur d'un divorce compliqué et potentiellement très coûteux. Un Français poursuit le géant du covoiturage pour 45 millions d'euros après qu'un bug dans l'application a alerté sa femme sur ses activités extraconjugales. Selon l'homme d'affaires anonyme, même après s'être déconnecté, l'application a continué à envoyer des notifications sur le téléphone de sa femme, détaillant les dates, heures et lieux de ses escapades romantiques. Le résultat ? Elle l'a poursuivi en divorce, et il s'est retourné contre Uber pour ne pas avoir protégé sa vie privée, car apparemment, la discrétion a un coût supplémentaire. Les utilisateurs d'Android peuvent cependant se détendre, le bug n'a mis en évidence que les utilisateurs d'iPhone.
Après que la nouvelle du bug a fait la une des journaux, Uber a créé une mise à jour pour l'application défectueuse. Le nombre de secondes qu'il a fallu aux utilisateurs d'iPhone pour télécharger et installer la mise à jour sur leurs téléphones est indiqué dans les données ci-dessous. \begin{array}{llllllllllllllll} 15 & 16 & 17 & 17 & 17 & 18 & 18 & 19 & 19 & 20 & 23 & 23 & 23 & 23 & 23 & 24 \\ 25 & 25 & 25 & 25 & 26 & 27 & 28 & 28 & 29 & 29 & 29 & 30 & 30 & 30 & 30 & 33 \\ 33 & 33 & 34 & 34 & 34 & 34 & 34 & 35 & 36 & 36 & 37 & 37 & 37 & 40 & 40 & 41 \\ 42 & 44 & 44 & 45 & 45 & 45 & 47 & 47 & 47 & 47 & 50 & 51 & 51 & 53 & 54 & 57 \end{array}
Question 17
Peppa Pig, le cadeau britannique aux enfants d'âge préscolaire, a paniqué certains parents américains après que leurs enfants ont commencé à parler avec un accent britannique et à dire « biscuits » au lieu de « cookies ». Les psychologues assurent à tout le monde que l'effet Peppa est temporaire, même s'il peut donner à l'heure du goûter une allure étrangement formelle. Quelqu'un veut du thé ?
Les données ci-dessous montrent le nombre d'heures qu'un groupe d'enfants a passé à regarder Peppa Pig l'année dernière. $$\begin{array}{|c|c|} \text { Nombre d'heures } & \text { Nombre d'enfants } \\ \hline 0-2 & 10 \\ 3-5 & 15 \\ 6-8 & 20 \\ 9-11 & 25 \\ 12-14 & 30 \\ 15-17 & 25 \\ 18-20 & 15 \\ \hline \end{array}$$
Question 18
En 2021, American Airlines a décidé de sévir contre les animaux de soutien émotionnel. Les chèvres, les serpents, les araignées et tout ce qui a des sabots, des défenses ou des cornes ont été officiellement interdits de vol, car rien ne dit mieux « vol relaxant » qu'une chèvre essayant de s'emparer du siège côté couloir. Les oiseaux non domestiques ont été ajoutés à la liste des animaux interdits, au grand désespoir d'une femme qui a été refoulée avec son paon de soutien émotionnel.
Les chiens de soutien émotionnel sont toujours autorisés sur les vols, mais ils doivent désormais voyager en soute. Les données ci-dessous montrent le poids de 32 chiens de soutien émotionnel qui ont été autorisés à voler le mois dernier.
$$\begin{array}{llllllllllllllll} 10 & 10 & 15 & 15 & 20 & 20 & 25 & 25 & 30 & 30 & 35 & 35 & 40 & 40 & 45 & 45 \\ 50 & 50 & 55 & 55 & 60 & 60 & 65 & 65 & 70 & 70 & 75 & 75 & 80 & 80 & 85 & 85 \end{array}$$