Introduction aux tests du Chi-deux
Test d'adéquation
Définition:
Coefficient de Dispersion
Le coefficient de détermination $CD$ pour un échantillon de $n$ observations est donné par $$CD = \frac{s}{\bar{x}}$$ où $s$ est l'écart type de l'échantillon et $\bar{x}$ est la moyenne de l'échantillon.
Remarque
La valeur du $CD$ peut être interprétée comme suit:
En général, une valeur du $CD$ inférieure à $0.2$ suggère une distribution normale, tandis qu'une valeur du $CD$ supérieure à $0.2$ suggère une distribution non normale.
Test d'adéquation du Chi-deux
Les tests statistiques sont formulés en termes d'hypothèse nulle $H_0$ et d'hypothèses alternatives, $H_1$. Pour un test d'adéquation du $\chi^2$, l'hypothèse nulle est l'énoncé selon lequel le modèle est approprié. L'hypothèse alternative est l'énoncé selon lequel le modèle n'est pas approprié. La valeur du $\chi^2$ définie ci-dessous est calculée à partir des données et est utilisée pour décider de rejeter ou non l'hypothèse nulle et de rejeter le modèle.
Formule:
Test d'adéquation du $\chi^2$
Les degrés de liberté pour ce test sont $df=k-m-1$ où $k$ est le nombre de catégories (cellules) et $m$ est le nombre de paramètres estimés dans le modèle.
Exemple 1
Un enseignant soupçonne qu'un dé peut être biaisé et demande aux élèves de le lancer $120$ fois. Les résultats observés sont: $$\begin{array}{|c|c|c|c|c|c|c|} \hline \text{Face} & 1 & 2 & 3 & 4 & 5 & 6 \\ \hline \text{Fréquence} & 15 & 25 & 20 & 18 & 22 & 20 \\ \hline \end{array}$$
En supposant que le dé est juste, chaque issue devrait avoir une probabilité égale. Effectuez un test d'adéquation du chi-deux à un niveau de signification de $5\%$.
Exemple 2
Un magasin d'animaux interroge 100 clients pour savoir quel type d'animal ils préfèrent. Le magasin s'attend à ce que les préférences soient uniformément réparties sur quatre catégories: chats, chiens, poissons et oiseaux. Cependant, les résultats de l'enquête sont les suivants: $$ \begin{array}{|c|c|c|c|c|} \hline \text{Animal} & \text{Chats} & \text{Chiens} & \text{Poissons} & \text{Oiseaux} \\ \hline \text{Fréquence} & 30 & 20 & 25 & 25 \\ \hline \end{array} $$
À un niveau de signification de $5\%$, testez s'il existe des preuves que la distribution des préférences pour les animaux diffère de la revendication du magasin.
Exemple 3
Un dé est lancé 60 fois et les fréquences suivantes sont obtenues: $$\begin{array}{|c|c|c|c|c|c|c|} \hline \text{Face} & 1 & 2 & 3 & 4 & 5 & 6 \\ \hline \text{Fréquence} & 8 & 10 & 12 & 9 & 11 & 10 \\ \hline \end{array}$$
Exemple 4
Un magasin de bonbons produit des sacs avec des bonbons de quatre couleurs: rouge, vert, bleu et jaune. Ils affirment que chaque couleur apparaît également souvent. Pour vérifier cela, un groupe de consommateurs sélectionne au hasard $200$ bonbons et observe: $$\begin{array}{|c|c|c|c|c|} \hline \text{Couleur} & R & V & B & J \\ \hline \text{Fréquence} & 55 & 45 & 50 & 50 \\ \hline \end{array}$$
Exemple 5
Une entreprise automobile affirme que ses couleurs de voiture sont également réparties parmi cinq couleurs: rouge, noir, bleu, blanc et marron. Pour vérifier cela, un groupe de consommateurs sélectionne au hasard $100$ voitures et observe: $$\begin{array}{|c|c|c|c|c|c|} \hline \text{Couleur} & Rouge & Noir & Bleu & Blanc & Marron \\ \hline \text{Fréquence} & 10 & 25 & 20 & 30 & 15\\ \hline \end{array}$$
Exemple 6
Une entreprise de boissons affirme que les préférences des clients pour ses cinq saveurs de boissons — Cola, Citron, Orange, Raisin et Mangue — sont également probables. Un chercheur en marketing interroge 200 clients et enregistre les réponses suivantes:$$\begin{array}{|c|c|c|c|c|} \hline \text{Saveur} & Cola & Citron & Orange & Raisin & Mangue \\ \hline \text{Fréquence} & 60 & 25 & 45 & 30 & 40\\ \hline \end{array}$$
Test du Chi-Deux d'Indépendance
Formule:
Test du Chi-Deux d'Indépendance
Remarque
Exemple 1
Le tableau suivant montre la distribution des bisons dans le parc national de Yellowstone par âge et emplacement. $$\begin{array}{|c|c|c|c|} \hline \text { Âge } & \text { Nord } & \text { Sud } & \text { Total } \\ \hline 0-1 & 10 & 20 & 30 \\ \hline 2-3 & 15 & 25 & 40 \\ \hline 4-5 & 20 & 30 & 50 \\ \hline \text { Total } & 45 & 75 & 120 \\ \hline \end{array} $$
Exemple 2
Un chercheur en santé publique souhaite savoir s'il existe une association entre le groupe d'âge et l'utilisation d'un nouveau médicament antidouleur en vente libre. Un échantillon de 150 individus est interrogé et classé comme suit : $$\begin{array}{|c|c|c|c|} \hline \text { Groupe d'âge } & \text { Utilisé le médicament } & \text { N'a pas utilisé le médicament } & \text { Total } \\ \hline 18-35 & 30 & 10 & 40 \\ \hline 36-55 & 25 & 25 & 50 \\ \hline 56+ & 10 & 50 & 60 \\ \hline \text { Total } & 65 & 85 & 150 \\ \hline \end{array} $$
Exemple 3
Un analyste de l'industrie automobile souhaite savoir si le type de voiture (SUV, berline ou camion) est associé à un type de carburant préféré (essence ou électrique). Un échantillon aléatoire de 120 acheteurs de voitures est interrogé, et les résultats sont les suivants : $$\begin{array}{|c|c|c|c|} \hline \text { Type de voiture } & \text { Essence } & \text { Électrique } & \text { Total } \\ \hline \text { SUV } & 30 & 10 & 40 \\ \hline \text { Berline } & 25 & 15 & 40 \\ \hline \text { Camion } & 20 & 20 & 40 \\ \hline \text { Total } & 75 & 45 & 120 \\ \hline \end{array} $$