Distributions de probabilité et fonctions de masse de probabilité

En théorie des probabilités, les variables aléatoires discrètes sont des variables qui peuvent prendre un nombre fini ou dénombrable de valeurs distinctes. Ces variables représentent souvent les résultats d'expériences ou d'événements, tels que le nombre de faces dans des lancers de pièces ou le lancer d'un dé.

Distributions de probabilité

Pour décrire le comportement d'une variable aléatoire discrète, nous utilisons une distribution de probabilité, qui attribue une probabilité à chaque valeur possible que la variable peut prendre.

Définition:

Distribution de probabilité

La distribution de probabilité d'une variable aléatoire, $X$, est une description des probabilités associées aux valeurs possibles de $X$

Fonctions de masse de probabilité

Un outil clé pour décrire les distributions de probabilité discrètes est la fonction de masse de probabilité (PMF). La PMF est une fonction qui spécifie la probabilité que la variable aléatoire prenne chaque valeur spécifique. Par exemple, si $X$ est le nombre de faces dans deux lancers de pièces, sa PMF montrerait les probabilités de $X=0, X=1$ et $X=2$.

Définition:

Fonction de masse de probabilité (PMF)

La fonction de masse de probabilité (PMF) d'une variable aléatoire discrète, $X$, est une fonction qui donne la probabilité que $X$ soit égal à une valeur spécifique, $x$. Elle est notée $P(X=x)$.
La PMF d'une variable aléatoire discrète peut être représentée de diverses manières, telles qu'un tableau, un graphique ou une formule. La PMF doit satisfaire deux propriétés :

Théorème:

Propriétés d'une fonction de masse de probabilité

Pour une variable aléatoire discrète $X$ avec PMF $P(X=x)$, les propriétés suivantes doivent être vérifiées :

  • $P(X=x) \geq 0$ pour toutes les valeurs de $x$
  • $\displaystyle \sum_{i=1}^n P(X=x) = 1$
La première propriété garantit que les probabilités sont non négatives, tandis que la deuxième propriété garantit que la somme de toutes les probabilités est égale à 1. Ces propriétés sont essentielles pour qu'une fonction soit une PMF valide.
La PMF fournit une description complète de la distribution de probabilité d'une variable aléatoire discrète. Elle nous permet de calculer les probabilités d'événements spécifiques et d'analyser le comportement de la variable aléatoire.
En pratique, la PMF est utilisée pour calculer des probabilités, des valeurs attendues et d'autres mesures statistiques liées aux variables aléatoires discrètes. Il s'agit d'un concept fondamental en théorie des probabilités et en statistique, formant la base de nombreux résultats et applications importants.

Exemple

Soit $X$ une variable aléatoire avec la distribution de probabilité suivante: $$\begin{array}{c|ccccc} x & -2 & -1 & 0 & 1 & 2 \\ \hline f(x) & 0.2 & 0.4 & 0.1 & 0.2 & 0.1\end{array}$$

Exemple

Soit $X$ une variable aléatoire avec la distribution de probabilité suivante:$$f(x)=\frac{2x+1}{25} \quad x=0,1,2,3,4$$

Exemple

Un système d'IA surveille les interactions des utilisateurs avec une nouvelle fonctionnalité d'application pour évaluer sa convivialité. Chaque interaction est classée comme ``réussie`` (l'utilisateur termine la tâche prévue) ou ``non réussie.`` Sur la base de données antérieures, la probabilité qu'une seule interaction soit réussie est de $0.85$ , et les interactions des utilisateurs sont indépendantes.

Exemple

Un dé équilibré à six faces est lancé deux fois. Soit $X$ la variable aléatoire représentant la somme des deux lancers. La fonction de masse de probabilité de $X$ peut être calculée en considérant tous les résultats possibles des deux lancers et leurs probabilités associées.

Exemple

Dans un laboratoire de recherche biologique, des scientifiques étudient la viabilité de deux types de graines dans un environnement contrôlé. Supposons que la probabilité qu'une graine de l'espèce A germe avec succès soit de $0.85$ , et que la probabilité qu'une graine de l'espèce B germe avec succès soit de $0.92$ . Supposons que la germination des graines des deux espèces est indépendante.

Valeur attendue d'une variable aléatoire discrète

Pour une variable aléatoire, $X$, deux nombres sont généralement utilisés pour résumer sa distribution de probabilité : la moyenne et la variance. La moyenne est une mesure de la tendance centrale et la variance est une mesure de la dispersion.
La valeur attendue d'une variable aléatoire discrète est une mesure du centre de la distribution. C'est la moyenne pondérée de toutes les valeurs possibles de la variable aléatoire, où les pondérations sont les probabilités des valeurs. La valeur attendue est également connue sous le nom de moyenne de la variable aléatoire.

Définition:

Valeur attendue

Soit $X$ une variable aléatoire discrète avec une fonction de masse de probabilité, $P(X)$.

La valeur attendue (moyenne) de $X$ est définie comme $$\mathbb{E}[X] = \sum_{i=1}^n x_i\cdot P(X=x_i)$$

Exemple

Lancez un dé. Quel est le nombre de points attendu?

Solution

Soit $X$ le nombre de points observés. La fonction de masse de probabilité de $X$ est

$$P(X) = \begin{cases} 1/6 & \text{si } X=1 \\ 1/6 & \text{si } X=2 \\ 1/6 & \text{si } X=3 \\ 1/6 & \text{si } X=4 \\ 1/6 & \text{si } X=5 \\ 1/6 & \text{si } X=6 \end{cases} $$ Le nombre de points attendu est

$\begin{align}\mathbb{E}[X] &= \sum_{i=1}^6 x_i \cdot P(X=x_i)\\ &= 1\cdot \frac{1}{6} + 2\cdot \frac{1}{6} + 3\cdot \frac{1}{6} + 4\cdot \frac{1}{6} + 5\cdot \frac{1}{6} + 6\cdot \frac{1}{6}\\ &= 3.5\end{align}$

Le nombre de points observés est $3.5$.

Exemple

Lancez deux dés. Quel est le nombre de points attendu?

Solution

Soit $X$ le nombre de points observés. La fonction de masse de probabilité de $X$ est $$\begin{array}{c|ccccccccccc} X=x & 2 & 3 & 4 & 5 & 6 & 7 & 8 & 9 & 10 & 11 & 12 \\ \hline P(X=x) & \frac{1}{36} & \frac{2}{36} & \frac{3}{36} & \frac{4}{36} & \frac{5}{36} & \frac{6}{36} & \frac{5}{36} & \frac{4}{36} & \frac{3}{36} & \frac{2}{36} & \frac{1}{36}\end{array}$$

Le nombre de points attendu est,

$$\begin{align} \mathbb{E}[X] &=\sum_{i=1}^{11} x_i\cdot P(X=x_i)\\ &= 2\cdot \frac{1}{36} + 3\cdot \frac{2}{36} + 4\cdot \frac{3}{36} + 5\cdot \frac{4}{36}+ \cdots + 12\cdot \frac{1}{36}\\ &= 7\end{align}$$

Le nombre de points observés est $7$.

Remarque

Alternativement:

Soit
$X_1=$ le nombre de points observés sur le premier dé
$X_2=$ le nombre de points observés sur le deuxième dé

$X=$ la somme des points observés sur les deux dés.

Alors, $$\mathbb{E}[X] = \mathbb{E}[X_1]+\mathbb{E}[X_2] = 3.5 + 3.5 = 7$$

Exemple

Dans les années 1990, une guerre de nudité a éclaté à la télévision brésilienne. Une chaîne a explosé en tête des audiences avec des feuilletons en première partie de soirée mettant en vedette la nudité frontale, tandis qu'une autre a riposté avec de la nudité non censurée dans des films. Pendant ce temps, une troisième chaîne a décidé de garder ses vêtements et de diffuser des adaptations littéraires de haute qualité à la place, ce qui lui a valu l'honneur d'avoir les pires audiences de l'histoire de la télévision.

Soit $x$ le nombre de feuilletons que regarde une personne brésilienne par semaine. Sur la base d'une enquête par échantillonnage d'adultes, la distribution de probabilité suivante a été préparée :

$$\begin{array}{c|ccccc} \hline x & 0 & 1 & 2 & 3 & 4 & 5 \\ \hline P(X=x) & 0.36 & 0.24 & 0.18 & 0.10 & 0.07 & 0.05 \\ \hline \end{array}$$

Exemple

Le marquis de Favras était un aristocrate français et un fervent partisan de la famille royale pendant la Révolution française. Marqué comme ennemi de l'État, il a été envoyé à la guillotine. En lisant son mandat de mort, il a plaisanté ``Je vois que vous avez fait trois fautes d'orthographe``. Soit $X$ représente le nombre de fautes d'orthographe dans un document sélectionné au hasard. La distribution de probabilité de $X$ est donnée par :

$$\begin{array}{l|ccccccccc}\hline x & 0 & 1 & 2 & 3 & 4 & 5 & 6 & 7 & 8 \\ \hline P(X=x) & 0.05 & 0.10 & 0.20 & 0.25 & 0.15 & 0.10 & 0.08 & 0.05 & 0.02 \\ \hline \end{array}$$

Résultats clés et propriétés de la valeur attendue

Lorsqu'il s'agit de la valeur attendue d'une variable aléatoire discrète, plusieurs résultats et propriétés importants sont fréquemment appliqués.

Valeur attendue d'une somme:

Si $X$ et $Y$ sont deux variables aléatoires, la valeur attendue de leur somme est: $$\mathbb{E}[X+Y]=\mathbb{E}[X]+\mathbb{E}[Y]$$ Cela est vrai indépendamment de la dépendance entre $X$ et $Y$.

Pour plus de variables: $$\mathbb{E}[X_1+X_2+\cdots+X_n]=\mathbb{E}[X_1]+\mathbb{E}[X_2]+\cdots+\mathbb{E}[X_n]$$

Transformation linéaire:

Si $X$ est une variable aléatoire et $a$ et $b$ sont des constantes, alors: $$\mathbb{E}(aX+b)=a\mathbb{E}[X]+b$$

Valeur attendue d'une constante:

Si $X$ est une variable aléatoire et $k$ est une constante, alors: $$\mathbb{E}[k]=k$$

Exemple

Un café vend deux types de desserts : des cookies et des gâteaux. La variable aléatoire $X$ représente les revenus des ventes de cookies en une journée (en dollars), tandis que $Y$ représente les revenus des ventes de gâteaux. Supposons que les informations suivantes soient données :

$\mathbb{E}[X]=50$ : Les revenus quotidiens attendus des cookies sont de $50 \$$.
$\mathbb{E}[X]=80$ : Les revenus quotidiens attendus des gâteaux sont de $80 \$$.

$X$ et $Y$ sont indépendants.

Le propriétaire du café souhaite analyser ses revenus quotidiens, qui incluent des transformations et des combinaisons de ces variables aléatoires.

Exemple

Une boulangerie vend deux types de produits : du pain et des gâteaux. La variable aléatoire $B$ représente le profit quotidien (en dollars) du pain, et $C$ représente le profit quotidien des gâteaux. Le gérant de la boulangerie a les informations suivantes :

$\mathbb{E}[B]=200$ : Le profit quotidien attendu du pain est de $200 \$$.
$\mathbb{E}[C]=150$ : Le profit quotidien attendu des gâteaux est de $150 \$$.

Variance et écart type d'une variable aléatoire discrète

La variance d'une variable aléatoire discrète est un concept fondamental en probabilité et statistiques qui mesure dans quelle mesure les valeurs de la variable s'écartent de sa valeur attendue (moyenne). Elle fournit une représentation numérique de la dispersion des résultats possibles de la variable, offrant des informations sur la variabilité des données.

Définition:

Variance d'une variable aléatoire discrète

Soit $X$ une variable aléatoire discrète avec une valeur attendue, $\mathbb{E}[X]$. La variance de $X$ est définie comme suit:$$\operatorname{Var}(X)=\sum_x(x-\mathbb{E}[X])^2\cdot P(X=x)$$ où

$\mathbb{E}[X]$ est la valeur attendue de $X$
$P(X=x)$ représente la probabilité que $X$ prenne la valeur $x$.

Théorème:

Variance

La variance d'une variable aléatoire discrète $X$ peut également être exprimée comme suit:$$\operatorname{Var}(X)=\mathbb{E}[X^2]-(\mathbb{E}[X])^2$$

Comme nous l'avons vu dans la section sur les mesures numériques de dispersion, l'écart type fournit une mesure de dispersion plus interprétable.

Définition:

Écart type d'une variable aléatoire discrète

L'écart type d'une variable aléatoire discrète $X$ est la racine carrée de sa variance, notée $\sigma_X=\sqrt{\operatorname{Var}(X)}$.

Exemple

Considérons une variable aléatoire discrète $X$ avec la distribution de probabilité suivante:$$\begin{array}{c|c|c}x&P(X=x)\\\hline 1&0.2\\2&0.3\\3&0.5\end{array}$$

Exemple

Considérons une variable aléatoire discrète $Y$ avec la distribution de probabilité suivante:$$\begin{array}{c|c|c}y&P(Y=y)\\\hline 0&0.1\\1&0.2\\2&0.3\\3&0.4\end{array}$$

Exemple

Une variable aléatoire $X$ représente le nombre de tâches réussies effectuées par un robot en une journée. La distribution de probabilité est la suivante: $$\begin{array}{c|c|c}x&P(X=x)\\\hline 0&0.1\\1&0.2\\2&0.3\\3&0.2\\4&0.1\\5&0.1\end{array}$$

Résultats clés et propriétés de la variance

La variance d'une variable aléatoire discrète possède plusieurs propriétés et résultats clés qui sont importants pour comprendre son comportement et ses implications:

Théorème:

Variance d'une somme (Variables indépendantes)

Si $X$ et $Y$ sont des variables aléatoires indépendantes, la variance de leur somme est la somme de leurs variances:$$\operatorname{Var}(X+Y)=\operatorname{Var}(X)+\operatorname{Var}(Y)$$ L'indépendance garantit qu'il n'y a pas de terme de covariance.

Théorème:

Variance d'une somme (Variables dépendantes)

Si $X$ et $Y$ sont des variables aléatoires dépendantes, la variance de leur somme est:$$\operatorname{Var}(X+Y)=\operatorname{Var}(X)+\operatorname{Var}(Y)+2\operatorname{Cov}(X,Y)$$ où $\operatorname{Cov}(X,Y)$ est la covariance entre $X$ et $Y$.

Théorème:

Variance d'une constante multipliée par une variable aléatoire

Pour une variable aléatoire $X$ et une constante $a$, la variance du produit de $a$ et $X$ est:$$\operatorname{Var}(aX)=a^2\operatorname{Var}(X)$$

Théorème:

Variance d'une combinaison linéaire

Pour les variables aléatoires $X$ et $Y$, et les constantes $a$ et $b$, la variance de la combinaison linéaire $aX+bY$ est:$$\operatorname{Var}(aX+bY)=a^2\operatorname{Var}(X)+b^2\operatorname{Var}(Y)+2ab\operatorname{Cov}(X,Y)$$ où $\operatorname{Cov}(X,Y)$ est la covariance entre $X$ et $Y$.

Théorème:

Variance d'une variable aléatoire constante

La variance d'une variable aléatoire constante $X=k$ est nulle:$$\operatorname{Var}(k)=0$$

Exemple

Une boulangerie vend des gâteaux et des cookies, et les ventes de chacun sont modélisées comme des variables aléatoires:

$X$ : Le chiffre d'affaires quotidien des gâteaux (en dollars), avec $\mathbb{E}[X]=50$ et $\operatorname{Var}(X)=25$
$Y$ : Le chiffre d'affaires quotidien des cookies (en dollars), avec $\mathbb{E}[Y]=30$ et $\operatorname{Var}(Y)=16$.

Supposons que les revenus des gâteaux et des cookies sont indépendants.

Exemple

Un café suit son chiffre d'affaires quotidien provenant du café et des muffins, qui sont modélisés comme des variables aléatoires:

$C$ : Le chiffre d'affaires quotidien des ventes de café (en dollars), avec $\mathbb{E}[C]=80$ et $\operatorname{Var}(C)=36$
$M$ : Le chiffre d'affaires quotidien des ventes de muffins (en dollars), avec $\mathbb{E}[M]=50$ et $\operatorname{Var}(M)=25$.

Les ventes de café et de muffins sont dépendantes, avec une covariance de $\operatorname{Cov}(C,M)=12$.

Exemple

Un biologiste étudie la relation entre l'exposition au soleil et la croissance des plantes. La croissance d'une plante ($G$, en centimètres par semaine) dépend des heures d'ensoleillement ($H$, en heures par jour) qu'elle reçoit. La relation est modélisée comme suit: $$ G=2 H+5$$


$H$ : Heures d'ensoleillement par jour, avec $\mathbb{E}[H]=6$ et $\operatorname{Var}(H)=1.5$.
$G$ : Croissance des plantes (en $cm/$ semaine), qui dépend de $H$.

Distribution Binomiale

La distribution binomiale est un type spécifique de distribution discrète. Elle est utilisée pour modéliser la probabilité d'obtenir un nombre spécifié de succès sur un nombre fixe d'essais, où chaque essai est indépendant et n'a que deux résultats.

Définition:

Variable Aléatoire Binomiale

Une variable aléatoire binomiale avec les paramètres, $n$, (nombre d'essais) et $p$, (probabilité de succès) est une variable aléatoire discrète avec pmf $$P(x)=\, C^n_x\,p^x(1-p)^{n-x}\qquad\qquad x=0,1,2,\dots, n$$
Remarque:$$ \sum_{x=1}^{n} p(x)=\sum_{x=1}^{n}\, C^n_x\, p^{x}(1-p)^{n-x}=(p+(1-p))^{n}=1^{n}=1$$

Caractéristiques d'une Expérience Binomiale

  • L'expérience consiste en $n$ essais identiques.
  • Chaque essai donne lieu à l'un des deux résultats: succès ou échec.
  • La probabilité de succès, $p$, est la même pour chaque essai.
  • Les essais sont indépendants.
  • Le nombre d'essais pour l'expérience, $n$, est fixe.
  • La Moyenne et la Variance d'une Variable Aléatoire Binomiale

    La valeur attendue et la variance d'une variable aléatoire binomiale fournissent des informations importantes sur son comportement.

    Formule:

    Moyenne d'une Variable Aléatoire Binomiale

    Si $X$ est une variable aléatoire binomiale représentant le nombre de succès dans $n$ essais indépendants, où la probabilité de succès dans chaque essai est $p$, alors la valeur attendue de $X$ est donnée par: $$\mathbb{E}[X]=\mu=n\cdot p$$
    La valeur attendue indique le nombre moyen de succès dans $n$ essais.
    La variance est une mesure reflétant la variabilité du nombre de succès

    Formule:

    Variance et Écart-type d'une Variable Aléatoire Binomiale

    La variance d'une variable aléatoire binomiale est donnée par: $$\sigma^2=V(X)=n\cdot p\cdot q$$ où $q=1-p$ est la probabilité d'échec. L'écart-type de $X$ est la racine carrée de la variance. Ainsi, l'écart-type de $X$ est: $$\sigma=\sqrt{n\cdot p\cdot q}$$
    La variance dépend à la fois de $n$ et de $p$ : un $n$ plus grand augmente la variabilité, tandis que les probabilités plus proches de 0.5 maximisent la variance en raison d'une plus grande incertitude dans les résultats.

    Exemple 1

    Il y a quelque chose chez les hommes grands qui rend les femmes irrésistibles. Une analyse des données obtenues de Yahoo! a révélé que pour les femmes, la taille est un facteur important lorsqu'il s'agit de décisions sur les rencontres. En fait, seuls $8 \%$ des femmes envisageraient de sortir avec un homme plus petit que $5^{\prime} 8''$.

    Parmi les 10 prochaines femmes que vous rencontrez, quelle est la probabilité que exactement quatre d'entre elles envisagent de sortir avec un homme plus petit que $5^{\prime}8''$?

    Soit $X$ le nombre de femmes qui envisageraient de sortir avec un homme plus petit que $5'8''$
    La pmf est $$P(X=x)=C^{10}_x\cdot (0.08)^x\cdot (1-0.08)^{10-x}\quad;\quad X=0,1,\dots,10$$
    La probabilité que exactement quatre d'entre elles envisagent de sortir avec un homme qui mesure moins de $5'8''$ est $P(X=4)=C^{10}_4\cdot (0.08)^4\cdot (0.92)^6=0.236$

    Solution

    Exemple 2

    Une enquête menée par la National Sleep Foundation a révélé que $40\%$ des Américains dorment moins que la quantité recommandée. Si 10 Américains sont choisis au hasard, quelle est la probabilité que exactement 3 d'entre eux dorment moins que la quantité recommandée?

    Soit $X$ le nombre d'Américains qui dorment moins que la quantité recommandée.
    La pmf est $$P(X=x)=C^{10}_x\cdot (0.4)^x\cdot (0.6)^{10-x}\quad;\quad X=0,1,\dots,10$$
    La probabilité que exactement 3 d'entre eux dorment moins que la quantité recommandée est $P(X=3)=C^{10}_3\cdot (0.4)^3\cdot (0.6)^7=0.215$

    Solution

    Exemple Long 1

    Lors d'un voyage en Finlande en 2005, le Premier ministre italien, Silvio Berlusconi, a insulté le pays en disant que les Finlandais ne mangeaient rien d'autre que de la viande de renne marinée et que leur cuisine était quelque chose à ``endurer`` et non à apprécier. Ne voulant pas laisser passer l'insulte, les Finlandais ont participé à un concours international de pizza et ont remporté la première place. Leur entrée gagnante, qui mettait en vedette des champignons sauvages et du renne fumé, s'appelait ``Pizza Berlusconi``. La vengeance n'a jamais eu aussi bon goût!

    Un récent sondage a révélé que $80\%$ des Finlandais commandaient régulièrement la Pizza Berlusconi lorsqu'ils mangeaient à l'extérieur. Dans un restaurant de pizza à Helsinki, six personnes s'apprêtent à déjeuner.

    Exemple

    Ark Encounter, une réplique de l'arche de Noé / parc à thème de plusieurs millions de dollars à Williamstown, Kentucky, est tout au sujet de survivre aux inondations... théoriquement. Alors que l'arche originale était conçue pour résister à 40 jours et 40 nuits de pluie, la version du Kentucky n'a pas tout à fait été à la hauteur du battage médiatique. Il s'avère qu'après 40 à 50 pouces de pluie tombés en mai '24, l'arche elle-même a été victime de dégâts dus aux inondations.

    Dans un retournement de situation si ironique qu'il semble divinement écrit, les avocats d'Ark Encounter poursuivent maintenant leurs assureurs pour avoir refusé de couvrir les dommages causés par l'eau.

    La probabilité qu'une compagnie d'assurance honore et indemnise un titulaire de police dont la propriété a été endommagée par une inondation est de $65 \%$. Dans les 30 prochaines réclamations où l'inondation était la cause des dommages matériels, quelle est

    Exemple

    En 2017, Lee De Paauw du Queensland, en Australie, a essayé d'impressionner une fille en sautant dans une rivière après avoir bu une grande quantité de vin. Il a immédiatement été attaqué par un crocodile de 3 mètres. Et malgré avoir réussi à repousser le crocodile, il n'a toujours pas réussi à obtenir un rendez-vous avec la fille qui l'intéressait.

    Sur la base de données historiques, il y a 10% de chances de rencontrer un crocodile lorsqu'on entre dans une rivière spécifique. Dans un geste audacieux et discutable, un groupe de 15 casse-cou a décidé de sauter dans cette rivière infestée de crocodiles pour tester leur chance.