Présentation des données
Tableau de fréquences
Définition:
Tableau de fréquences
Comment faire un tableau de fréquences
- Trier les données par ordre croissant.
- Décider du nombre de classes ou d'intervalles à utiliser (généralement entre $5$ et $10$ classes).
- Calculer la largeur de la classe: $$\begin{align*} \text{largeur de la classe} &=\frac{Valeur\, la\, plus\, grande - Valeur\, la\, plus\, petite}{ nombre \, de\, classes} \\ \quad & \Rightarrow \quad \text{et arrondir } \end{align*} $$
- Déterminer les limites de classe.
Pour générer la limite inférieure de chaque classe, commencez par la plus petite valeur de l'ensemble de données. Descendez dans le tableau, et ajoutez la largeur de la classe à chaque valeur précédente jusqu'à ce que le nombre de classes souhaité ait été peuplé de son point final respectif.
Pour déterminer la limite supérieure de la première classe, soustrayez 1 de la limite inférieure de la deuxième classe. Descendez dans le tableau et fermez chaque classe en ajoutant la largeur de la classe à la valeur précédente. - Faire le décompte des données
Règle générale
- Utiliser moins de cinq classes pourrait entraîner une perte d'informations trop importante
- Utiliser plus de dix classes pourrait entraîner une mauvaise synthèse des données.
Remarque
- Chaque point de données est inclus dans une seule classe.
- Les classes sont mutuellement exclusives (c'est-à-dire qu'aucune des classes ne se chevauche).
- Les classes sont exhaustives (c'est-à-dire que toutes les données sont capturées et prises en compte).
Exemple 1
Considérez l'ensemble de données suivant: $$1, 2, 3, 4, 5, 6, 7, 8, 9, 10 $$ Si nous décidons d'utiliser $5$ classes. Déterminez la largeur de la classe.
La largeur de la classe est calculée comme suit:
$$\text{largeur de la classe}=\frac{Plus\, grand - Plus\, petit}{Nombre\, de \, classes}=\frac{10 - 1}{5} = 1.8 \quad \Rightarrow \quad 2$$
Par conséquent, la largeur de la classe est de $2$.
Solution
Exemple 2
Considérez l'ensemble de données suivant: $$27, 30, 33, 45, 45, 46, 49, $$ $$55, 56, 58, 64, 67, 70 $$ Si nous décidons d'utiliser $7$ classes. Déterminez les limites de classe.
La largeur de la classe est calculée comme suit:
$$\text{largeur de la classe} = \frac{Plus\, grand - Plus\, petit}{Nombre\, de \, classes}=\frac{70 - 27}{7} = 6.14 \quad \Rightarrow \quad 7$$
Par conséquent, la largeur de la classe est de $7$.
Solution
Exemple 3
Considérez l'ensemble de données suivant: $$27, 31, 35, 46, 46, 49, $$ $$ 49, 53, 55, 58, 60, 77 $$ Si nous décidons d'utiliser $5$ classes. Déterminez les limites de classe.
La largeur de la classe est calculée comme suit:
$$\text{largeur de la classe} = \frac{Plus\, grand - Plus\, petit}{Nombre\, de \, classes}=\frac{77 - 27}{5} = 10 \quad \Rightarrow \quad 11$$
Par conséquent, la largeur de la classe est de $11$.
Solution
Exemple 4
Considérez l'ensemble de données suivant: $$27, 30, 33, 45, 45, 46, 49, $$ $$ 55, 56, 58, 64, 67, 70 $$ Si nous décidons d'utiliser $6$ classes.
Exemple 5
Considérez l'ensemble de données suivant: $$12, 23, 33, 43, 44, 47, 49, 52, 56, 58, 60, 65, 75 $$ Si nous décidons d'utiliser $7$ classes.
Distributions de fréquences
Définition:
Distribution de fréquence
- Le point médian est le nombre du milieu de chaque classe. Il est obtenu en additionnant les limites supérieures et inférieures ensemble puis en divisant par deux. Le point médian est utilisé pour estimer la moyenne ou la moyenne pour les données groupées.
- La fréquence relative affiche la proportion de données qui tombent dans chaque catégorie. Il peut être représenté en format décimal ou en pourcentages.
Formule:
Fréquences relatives
$f=$ la fréquence de la classe
$n=$ le nombre total d'observations.
Exemple 6
Wayne Enterprises est un conglomérat basé aux États-Unis avec des intérêts dans la technologie, la fabrication et la recherche sur les armes. Le PDG de l'entreprise, Bruce Wayne, aime suivre combien de temps chacun de ses employés est absent pendant sa pause déjeuner. Voici les résultats des 60 employés qui travaillent pour lui arrondis à la minute la plus proche. $$\begin{array}{lllllllllllllll} 35 & 35 & 35 & 35 & 35 & 36 & 36 & 36 & 36 & 36 & 36 & 36 & 36 & 36 & 36 \\ 36 & 37 & 37 & 38 & 38 & 38 & 39 & 40 & 40 & 40 & 40 & 40 & 40 & 40 & 40 \\ 41 & 41 & 41 & 41 & 41 & 41 & 42 & 42 & 43 & 43 & 43 & 43 & 43 & 43 & 44 \\ 44 & 44 & 44 & 44 & 45 & 45 & 45 & 45 & 47 & 48 & 49 & 50 & 50 & 50 & 55\end{array}$$
Fréquences cumulées
Définition:
Fréquences cumulées inférieures à (LTCF)
Exemple 7
Considérez à nouveau les données de pause déjeuner pour Wayne Enterprises. $$\begin{array}{lllllllllllllll} 35 & 35 & 35 & 35 & 35 & 36 & 36 & 36 & 36 & 36 & 36 & 36 & 36 & 36 & 36 \\ 36 & 37 & 37 & 38 & 38 & 38 & 39 & 40 & 40 & 40 & 40 & 40 & 40 & 40 & 40 \\ 41 & 41 & 41 & 41 & 41 & 41 & 42 & 42 & 43 & 43 & 43 & 43 & 43 & 43 & 44 \\ 44 & 44 & 44 & 44 & 45 & 45 & 45 & 45 & 47 & 48 & 49 & 50 & 50 & 50 & 55\end{array}$$
Définition:
Fréquences cumulées supérieures à (MTCF)
Exemple 8
Voici à nouveau les données de pause déjeuner pour Wayne Enterprises. $$\begin{array}{lllllllllllllll} 35 & 35 & 35 & 35 & 35 & 36 & 36 & 36 & 36 & 36 & 36 & 36 & 36 & 36 & 36 \\ 36 & 37 & 37 & 38 & 38 & 38 & 39 & 40 & 40 & 40 & 40 & 40 & 40 & 40 & 40 \\ 41 & 41 & 41 & 41 & 41 & 41 & 42 & 42 & 43 & 43 & 43 & 43 & 43 & 43 & 44 \\ 44 & 44 & 44 & 44 & 45 & 45 & 45 & 45 & 47 & 48 & 49 & 50 & 50 & 50 & 55\end{array}$$
Exemple 9
Le Presidential Daily Briefing (PDB) est un document top secret qui détaille les problèmes et les développements les plus pressants du monde entier. Le rapport est préparé tous les jours pour que le président des États-Unis le révise, mais Donald Trump dit qu'il n'a pas besoin du Daily Briefing parce qu'il est ``intelligent``. De plus, il n'aime pas lire - donc il a quelqu'un qui le lit pendant qu'il écoute. Il a également mentionné qu'il aimerait que les PBD soient plus courts et contiennent plus de ``graphiques tueurs``. Le nombre de pages pour 75 PDB est le suivant: $$\begin{array}{ccccccccccccccc} 50 & 51 & 51 & 52 & 52 & 53 & 53 & 54 & 55 & 55 & 56 & 56 & 57 & 57 & 57 \\ 60 & 60 & 60 & 61 & 62 & 63 & 64 & 65 & 66 & 66 & 68 & 69 & 69 & 70 & 70 \\ 70 & 70 & 70 & 71 & 71 & 71 & 72 & 73 & 73 & 74 & 75 & 75 & 75 & 78 & 79 \\ 80 & 80 & 82 & 83 & 87 & 88 & 94 & 95 & 95 & 96 & 99 & 99 & 99 & 99 & 100 \\ 100 & 101 & 101 & 112 & 112 & 113 & 114 & 115 & 117 & 117 & 120 & 121 & 124 & 124 & 124\end{array}
Représentation graphique des données
Histogrammes et graphiques à barres
Dans un histogramme, les données continues sont regroupées en intervalles, et la hauteur de chaque barre représente la fréquence des points de données dans cet intervalle. Dans un graphique à barres, les données discrètes ou catégorielles sont regroupées en catégories, et la hauteur de chaque barre représente la fréquence des points de données dans cette catégorie.
Remarque
Graphiques à barres
Exemple 10
The Codfather est un restaurant situé en Caroline du Sud qui sert du poisson et des frites. Selon Trip Advisor, c'est le #1 eatery de la ville, et les données ci-dessous montrent le nombre de combos déjeuner de morue et de frites servis en 2021. $$\ \begin{array}{|c|c|} \hline \text{Mois} & \text{Déjeuners de morue et de frites servis} \\ \hline \text{Janvier} & 186 \\ \text{Février} & 131 \\ \text{Mars} & 123 \\ \text{Avril} & 98 \\ \text{Mai} & 87 \\ \text{Juin} & 56 \\ \text{Juillet} & 45 \\ \text{Août} & 23 \\ \text{Septembre} & 12 \\ \text{Octobre} & 63 \\ \text{Novembre} & 73 \\ \text{Décembre} & 81 \\ \hline\end{array} $$
Nombre de déjeuners de morue et de frites servis
Exemple 11
Life of Pie est une pâtisserie dont le nom est un jeu de mots sur le roman et le film ``Life of Pi.`` Les données ci-dessous montrent les types de tartes qui ont été vendues la semaine dernière. $$\begin{array}{|c|c|} \hline \text{Garniture de tarte} & \text{Tartes vendues} \\ \hline Pomme & 186 \\ Myrtille & 131 \\ Flan & 123 \\ Citron \, vert & 98 \\ Épices \, de\, citrouille & 87 \\ Crème \, de \, noix \, de\, coco & 56 \\ Fraise & 45 \\ \hline \end{array} $$
Ventes de tartes
Exemple 12
Un dé est lancé 100 fois, et le nombre de points qui apparaît est enregistré dans le tableau ci-dessous $$\begin{array}{|c|c|} \hline \text{Points} & \text{Fréquence} \\ \hline 1 & 18 \\ 2 & 13 \\ 3 & 13 \\ 4 & 15 \\ 5 & 12 \\ 6 & 16 \\ \hline \end{array} $$
Nombre de points sur un dé
Histogrammes
Remarque
Exemple 13
Planet of the Grapes est une cave à vin dont le nom est inspiré du film ``Planet of the Apes.`` Les données ci-dessous montrent les prix des bouteilles de vin vendues la semaine dernière. $$\begin{array}{|c|c|} \hline \text{Prix de la bouteille} & \text{Fréquence} \\ 0-50 & 3 \\ 51-100 & 7 \\ 101-150 & 12 \\ 151-200 & 8 \\ 201-250 & 5 \\ 251-300 & 3 \\ \hline \end{array} $$
Solution
Comme les prix sont continus, les limites de classe sont étendues de $0.5$ pour créer des frontières de classe. Le tableau et l'histogramme ci-dessous illustrent la fréquence des bouteilles de vin vendues chez Planet of the Grapes. $$\begin{array}{|c|c|c|} \hline \text{Prix de la bouteille} & \text{Frontières de classe} & \text{Fréquence} \\ 0-50 & -0.5 - 50.50 & 3 \\ 51-100 & 50.5-100.5 & 7 \\ 101-150 & 100.5-150.5 & 12 \\ 151-200 & 150.5-200.5 & 8 \\ 201-250 & 200.5-250.5 & 5 \\ 251-300 & 250.5-300.5 & 3 \\ \hline \end{array} $$
Prix des bouteilles de vin
Formes et attributs
Distribution inclinée vers la gauche (négativement)
Distribution inclinée vers la droite (positivement)
Distribution symétrique
Distribution uniforme
Distribution bimodale
Exemple 14
Lorsqu'il s'agit de choisir entre perdre un membre ou vivre sans internet, des Américains qui ont répondu à un sondage préféreraient plutôt se couper un doigt que de couper l'internet. Les Américains passent plus de temps à consommer des médias en ligne qu'à dormir, en moyenne environ 10,5 heures par jour connectés à Internet. Un échantillon aléatoire de 56 personnes aux États-Unis a été interrogé sur le nombre de minutes qu'elles passent en ligne par jour. Voici les résultats : $$\begin{array}{llllllllllllll} 120 & 121 & 125 & 127 & 127 & 128 & 130 & 134 & 134 & 134 & 130 & 134 & 134 & 135 \\ 141 & 141 & 142 & 142 & 143 & 144 & 145 & 146 & 147 & 147 & 148 & 148 & 148 & 148 \\ 150 & 150 & 150 & 150 & 150 & 151 & 152 & 153 & 154 & 154 & 155 & 155 & 155 & 155 \\ 155 & 155 & 157 & 157 & 157 & 157 & 157 & 158 & 158 & 158 & 158 & 158 & 160 & 160 \end{array}$$
Nombre de minutes passées en ligne
Exercices
Question 1
Pour la variable aléatoire ``Nombre de voitures possédées par les ménages d'une ville``, devriez-vous utiliser un diagramme en barres ou un histogramme?
Diagramme en barres car le ``nombre de voitures`` est une variable discrète avec des valeurs spécifiques (par exemple, 0, 1, 2).
Solution
Question 2
Les ventes d'un magasin sont suivies quotidiennement sur une semaine, chaque jour étant catégorisé (lundi, mardi, etc.). Quel type de graphique devrait être utilisé, et pourquoi?
Diagramme en barres car les jours de la semaine sont des données catégoriques.
Solution
Question 3
Un chercheur collecte des données sur le temps (en secondes) mis par les participants pour accomplir une tâche. S'ils veulent afficher la distribution de fréquence des temps de réalisation, quelle visualisation devraient-ils utiliser et pourquoi?
Histogramme car les temps de réalisation sont des données continues qui peuvent être regroupées en intervalles.
Solution
Question 4
Un enseignant enregistre les notes (A, B, C, D, F) des étudiants dans une classe. L'enseignant doit-il utiliser un diagramme en barres ou un histogramme pour représenter ces données? Expliquer
Diagramme en barres car les notes sont des données catégoriques avec des catégories distinctes.
Solution
Question 5
Une enquête collecte des données sur l'âge des participants en années. Les données doivent-elles être visualisées avec un diagramme en barres ou un histogramme?
Histogramme car l'âge est une variable continue qui peut être regroupée en intervalles.
Solution
Question 6
Un magasin enregistre les ventes quotidiennes en dollars sur une période d'un mois. Quel type de graphique serait le plus approprié pour visualiser ces données?
Graphique en ligne ou graphique à barres pour montrer les variations des ventes quotidiennes sur le mois.
Solution
Question 7
Un sondage demande aux participants de classer leur satisfaction sur une échelle de 1 à 5. Quel type de graphique serait le plus adapté pour représenter ces données?
Diagramme en barres ou diagramme circulaire pour montrer la répartition des réponses sur l'échelle de satisfaction.
Solution
Question 8
Un chercheur enregistre les températures quotidiennes en degrés Celsius pendant un mois. Quel type de graphique serait le plus approprié pour visualiser ces données?
Graphique en ligne ou histogramme pour montrer les variations des températures quotidiennes sur le mois.
Solution
Question 9
Un sondage demande aux participants de choisir leur couleur préférée parmi une liste de couleurs. Quel type de graphique serait le plus adapté pour représenter ces données?
Diagramme en barres ou diagramme circulaire pour montrer la répartition des préférences de couleur parmi les participants.
Solution
Question 10
Un chercheur enregistre les hauteurs des participants en centimètres. Quel type de graphique serait le plus approprié pour visualiser ces données?
Histogramme pour montrer la distribution des hauteurs des participants en intervalles de taille.
Solution
Question 11
En 1753, un magazine londonien a répertorié les styles de perruques suivants : le chou-fleur, l'aile de pigeon, le rhinocéros, l'escalier et le dos de sanglier. Supposons qu'une enquête menée dans un magasin de perruques cette année-là ait enregistré les préférences de 100 clients pour ces styles de perruques, ce qui a donné les données suivantes :
Les données ci-dessous montrent les poids de $40$ perruques en chou-fleur (en grammes) datant de 1753
$$\begin{array}{rrrrrrrrrr} \hline 570 & 572 & 573 & 575 & 576 & 578 & 580 & 583 & 591 & 595 \\ \hline 602 & 607 & 620 & 625 & 628 & 628 & 629 & 630 & 632 & 632 \\ \hline 633 & 633 & 634 & 638 & 639 & 640 & 644 & 645 & 646 & 646 \\ \hline 653 & 657 & 658 & 663 & 666 & 667 & 667 & 670 & 675 & 675 \\ \hline \end{array}$$
Question 12
Deimos, l'une des lunes de Mars, a un cratère appelé Swift, et l'autre, Phobos, a une région appelée Laputa. C'est parce que dans les Voyages de Gulliver de Jonathan Swift, les astronomes découvrent que Mars a 2 lunes. Le roman est sorti en 1726 - 151 ans avant la découverte réelle.
Quarante étudiants ont été invités à lire les Voyages de Gulliver la semaine dernière d'une traite. Le temps pris par chaque étudiant pour lire le livre est enregistré dans le tableau ci-dessous.
$$\begin{array}{rrrrrrrrrr} \hline 100 & 100 & 101 & 101 & 102 & 103 & 103 & 105 & 105 & 106 \\ \hline 109 & 109 & 109 & 111 & 112 & 113 & 114 & 115 & 115 & 118 \\ \hline 118 & 119 & 122 & 124 & 125 & 126 & 127 & 127 & 127 & 128 \\ \hline 129 & 131 & 133 & 133 & 133 & 133 & 135 & 140 & 140 & 142 \\ \hline \end{array}$$
Question 13
Un dessin animé des années 1970 appelé Rascal the Raccoon a déclenché une folie au Japon pour garder les ratons laveurs comme animaux de compagnie. Leurs descendants sauvages ont depuis causé tant de dégâts que Tokyo dispose désormais d'une ligne téléphonique que vous pouvez appeler pour signaler des observations.
Le poids de 30 ratons laveurs domestiques, arrondi à la livre près, est présenté ci-dessous $$ \begin{array}{rrrrrrrrrr} \hline 9 & 9 & 10 & 10 & 10 & 10 & 10 & 11 & 11 & 11 \\ \hline 11 & 12 & 12 & 12 & 13 & 13 & 13 & 14 & 14 & 15 \\ \hline 15 & 16 & 16 & 17 & 17 & 17 & 18 & 19 & 19 & 20 \\ \hline \end{array} $$
Question 14
Un récent sondage au Royaume-Uni a révélé que $12\%$ des Britanniques aiment leurs animaux de compagnie plus qu'ils n'aiment leur partenaire. $9 \%$ aiment leurs animaux de compagnie plus qu'ils n'aiment leurs enfants. Quarante Britanniques ont été interrogés sur le temps qu'ils passent en moyenne avec leurs animaux de compagnie chaque jour. Les résultats sont présentés dans le tableau ci-dessous.
$$\begin{array}{rrrrrrrrrr} \hline 120 & 121 & 121 & 123 & 124 & 127 & 128 & 130 & 130 & 132 \\ \hline 133 & 135 & 136 & 138 & 139 & 139 & 140 & 141 & 148 & 148 \\ \hline 150 & 150 & 151 & 154 & 155 & 162 & 162 & 163 & 163 & 163 \\ \hline 164 & 168 & 168 & 170 & 176 & 177 & 177 & 178 & 179 & 180 \\ \hline \end{array}$$
Question 15
Aux États-Unis, vous pouvez envoyer des scorpions vivants par la poste - s'ils sont à l'intérieur d'une boîte étiquetée ``scorpions vivants``, à l'intérieur d'une autre boîte également étiquetée ``scorpions vivants``.
La durée de vie de 40 scorpions américains en mois est présentée ci-dessous $$\begin{array}{rrrrrrrrrr} \hline 37 & 38 & 38 & 38 & 38 & 40 & 41 & 41 & 41 & 42 \\ \hline 43 & 44 & 45 & 47 & 47 & 47 & 48 & 49 & 51 & 51 \\ \hline 51 & 52 & 55 & 56 & 56 & 56 & 57 & 58 & 58 & 59 \\ \hline 60 & 60 & 62 & 63 & 65 & 65 & 66 & 66 & 68 & 68 \\ \hline \end{array}$$
Question 16
Une entreprise parisienne a mis en place un ``hôpital`` pour aider à ramener à la vie les plantes de bureau mourantes des gens.
Le nombre de jours que 40 plantes de bureau ont passé à récupérer à l'hôpital est présenté ci-dessous $$\begin{array}{cccccccccc} \hline 6 & 9 & 9 & 9 & 10 & 10 & 11 & 12 & 12 & 13 \\ \hline 13 & 14 & 15 & 15 & 16 & 17 & 18 & 19 & 19 & 19 \\ \hline 21 & 21 & 21 & 22 & 22 & 25 & 25 & 25 & 25 & 26 \\ \hline 27 & 27 & 27 & 28 & 28 & 28 & 29 & 29 & 30 & 30 \\ \hline \end{array} $$