Distributions de probabilité et fonctions de masse de probabilité
Distributions de probabilité
Définition:
Distribution de probabilité
Fonctions de masse de probabilité
Définition:
Fonction de masse de probabilité (PMF)
Théorème:
Propriétés d'une fonction de masse de probabilité
- $P(X=x) \geq 0$ pour toutes les valeurs de $x$
- $\displaystyle \sum_{i=1}^n P(X=x) = 1$
Exemple
Soit $X$ une variable aléatoire avec la distribution de probabilité suivante: $$\begin{array}{c|ccccc} x & -2 & -1 & 0 & 1 & 2 \\ \hline f(x) & 0.2 & 0.4 & 0.1 & 0.2 & 0.1\end{array}$$
Exemple
Soit $X$ une variable aléatoire avec la distribution de probabilité suivante:$$f(x)=\frac{2x+1}{25} \quad x=0,1,2,3,4$$
Exemple
Un système d'IA surveille les interactions des utilisateurs avec une nouvelle fonctionnalité d'application pour évaluer sa convivialité. Chaque interaction est classée comme ``réussie`` (l'utilisateur termine la tâche prévue) ou ``non réussie.`` Sur la base de données antérieures, la probabilité qu'une seule interaction soit réussie est de $0.85$ , et les interactions des utilisateurs sont indépendantes.
Exemple
Un dé équilibré à six faces est lancé deux fois. Soit $X$ la variable aléatoire représentant la somme des deux lancers. La fonction de masse de probabilité de $X$ peut être calculée en considérant tous les résultats possibles des deux lancers et leurs probabilités associées.
Exemple
Dans un laboratoire de recherche biologique, des scientifiques étudient la viabilité de deux types de graines dans un environnement contrôlé. Supposons que la probabilité qu'une graine de l'espèce A germe avec succès soit de $0.85$ , et que la probabilité qu'une graine de l'espèce B germe avec succès soit de $0.92$ . Supposons que la germination des graines des deux espèces est indépendante.
Valeur attendue d'une variable aléatoire discrète
Définition:
Valeur attendue
La valeur attendue (moyenne) de $X$ est définie comme $$\mathbb{E}[X] = \sum_{i=1}^n x_i\cdot P(X=x_i)$$
Exemple
Lancez un dé. Quel est le nombre de points attendu?
Solution
Soit $X$ le nombre de points observés. La fonction de masse de probabilité de $X$ est
$$P(X) = \begin{cases} 1/6 & \text{si } X=1 \\ 1/6 & \text{si } X=2 \\ 1/6 & \text{si } X=3 \\ 1/6 & \text{si } X=4 \\ 1/6 & \text{si } X=5 \\ 1/6 & \text{si } X=6 \end{cases} $$ Le nombre de points attendu est
$\begin{align}\mathbb{E}[X] &= \sum_{i=1}^6 x_i \cdot P(X=x_i)\\ &= 1\cdot \frac{1}{6} + 2\cdot \frac{1}{6} + 3\cdot \frac{1}{6} + 4\cdot \frac{1}{6} + 5\cdot \frac{1}{6} + 6\cdot \frac{1}{6}\\ &= 3.5\end{align}$
Le nombre de points observés est $3.5$.
Exemple
Lancez deux dés. Quel est le nombre de points attendu?
Solution
Soit $X$ le nombre de points observés. La fonction de masse de probabilité de $X$ est $$\begin{array}{c|ccccccccccc} X=x & 2 & 3 & 4 & 5 & 6 & 7 & 8 & 9 & 10 & 11 & 12 \\ \hline P(X=x) & \frac{1}{36} & \frac{2}{36} & \frac{3}{36} & \frac{4}{36} & \frac{5}{36} & \frac{6}{36} & \frac{5}{36} & \frac{4}{36} & \frac{3}{36} & \frac{2}{36} & \frac{1}{36}\end{array}$$
Le nombre de points attendu est,
$$\begin{align} \mathbb{E}[X] &=\sum_{i=1}^{11} x_i\cdot P(X=x_i)\\ &= 2\cdot \frac{1}{36} + 3\cdot \frac{2}{36} + 4\cdot \frac{3}{36} + 5\cdot \frac{4}{36}+ \cdots + 12\cdot \frac{1}{36}\\ &= 7\end{align}$$
Le nombre de points observés est $7$.
Remarque
Soit
$X_1=$ le nombre de points observés sur le premier dé
$X_2=$ le nombre de points observés sur le deuxième dé
$X=$ la somme des points observés sur les deux dés.
Alors, $$\mathbb{E}[X] = \mathbb{E}[X_1]+\mathbb{E}[X_2] = 3.5 + 3.5 = 7$$
Exemple
Dans les années 1990, une guerre de nudité a éclaté à la télévision brésilienne. Une chaîne a explosé en tête des audiences avec des feuilletons en première partie de soirée mettant en vedette la nudité frontale, tandis qu'une autre a riposté avec de la nudité non censurée dans des films. Pendant ce temps, une troisième chaîne a décidé de garder ses vêtements et de diffuser des adaptations littéraires de haute qualité à la place, ce qui lui a valu l'honneur d'avoir les pires audiences de l'histoire de la télévision.
Soit $x$ le nombre de feuilletons que regarde une personne brésilienne par semaine. Sur la base d'une enquête par échantillonnage d'adultes, la distribution de probabilité suivante a été préparée :
$$\begin{array}{c|ccccc} \hline x & 0 & 1 & 2 & 3 & 4 & 5 \\ \hline P(X=x) & 0.36 & 0.24 & 0.18 & 0.10 & 0.07 & 0.05 \\ \hline \end{array}$$
Exemple
Le marquis de Favras était un aristocrate français et un fervent partisan de la famille royale pendant la Révolution française. Marqué comme ennemi de l'État, il a été envoyé à la guillotine. En lisant son mandat de mort, il a plaisanté ``Je vois que vous avez fait trois fautes d'orthographe``. Soit $X$ représente le nombre de fautes d'orthographe dans un document sélectionné au hasard. La distribution de probabilité de $X$ est donnée par :
$$\begin{array}{l|ccccccccc}\hline x & 0 & 1 & 2 & 3 & 4 & 5 & 6 & 7 & 8 \\ \hline P(X=x) & 0.05 & 0.10 & 0.20 & 0.25 & 0.15 & 0.10 & 0.08 & 0.05 & 0.02 \\ \hline \end{array}$$
Résultats clés et propriétés de la valeur attendue
Valeur attendue d'une somme:
Pour plus de variables: $$\mathbb{E}[X_1+X_2+\cdots+X_n]=\mathbb{E}[X_1]+\mathbb{E}[X_2]+\cdots+\mathbb{E}[X_n]$$
Transformation linéaire:
Valeur attendue d'une constante:
Exemple
Un café vend deux types de desserts : des cookies et des gâteaux. La variable aléatoire $X$ représente les revenus des ventes de cookies en une journée (en dollars), tandis que $Y$ représente les revenus des ventes de gâteaux. Supposons que les informations suivantes soient données :
$\mathbb{E}[X]=50$ : Les revenus quotidiens attendus des cookies sont de $50 \$$.
$\mathbb{E}[X]=80$ : Les revenus quotidiens attendus des gâteaux sont de $80 \$$.
$X$ et $Y$ sont indépendants.
Le propriétaire du café souhaite analyser ses revenus quotidiens, qui incluent des transformations et des combinaisons de ces variables aléatoires.
Exemple
Une boulangerie vend deux types de produits : du pain et des gâteaux. La variable aléatoire $B$ représente le profit quotidien (en dollars) du pain, et $C$ représente le profit quotidien des gâteaux. Le gérant de la boulangerie a les informations suivantes :
$\mathbb{E}[B]=200$ : Le profit quotidien attendu du pain est de $200 \$$.
$\mathbb{E}[C]=150$ : Le profit quotidien attendu des gâteaux est de $150 \$$.
Variance et écart type d'une variable aléatoire discrète
Définition:
Variance d'une variable aléatoire discrète
$\mathbb{E}[X]$ est la valeur attendue de $X$
$P(X=x)$ représente la probabilité que $X$ prenne la valeur $x$.
Théorème:
Variance
Définition:
Écart type d'une variable aléatoire discrète
Exemple
Considérons une variable aléatoire discrète $X$ avec la distribution de probabilité suivante:$$\begin{array}{c|c|c}x&P(X=x)\\\hline 1&0.2\\2&0.3\\3&0.5\end{array}$$
Exemple
Considérons une variable aléatoire discrète $Y$ avec la distribution de probabilité suivante:$$\begin{array}{c|c|c}y&P(Y=y)\\\hline 0&0.1\\1&0.2\\2&0.3\\3&0.4\end{array}$$
Exemple
Une variable aléatoire $X$ représente le nombre de tâches réussies effectuées par un robot en une journée. La distribution de probabilité est la suivante: $$\begin{array}{c|c|c}x&P(X=x)\\\hline 0&0.1\\1&0.2\\2&0.3\\3&0.2\\4&0.1\\5&0.1\end{array}$$
Résultats clés et propriétés de la variance
Théorème:
Variance d'une somme (Variables indépendantes)
Théorème:
Variance d'une somme (Variables dépendantes)
Théorème:
Variance d'une constante multipliée par une variable aléatoire
Théorème:
Variance d'une combinaison linéaire
Théorème:
Variance d'une variable aléatoire constante
Exemple
Une boulangerie vend des gâteaux et des cookies, et les ventes de chacun sont modélisées comme des variables aléatoires:
$X$ : Le chiffre d'affaires quotidien des gâteaux (en dollars), avec $\mathbb{E}[X]=50$ et $\operatorname{Var}(X)=25$
$Y$ : Le chiffre d'affaires quotidien des cookies (en dollars), avec $\mathbb{E}[Y]=30$ et $\operatorname{Var}(Y)=16$.
Supposons que les revenus des gâteaux et des cookies sont indépendants.
Exemple
Un café suit son chiffre d'affaires quotidien provenant du café et des muffins, qui sont modélisés comme des variables aléatoires:
$C$ : Le chiffre d'affaires quotidien des ventes de café (en dollars), avec $\mathbb{E}[C]=80$ et $\operatorname{Var}(C)=36$
$M$ : Le chiffre d'affaires quotidien des ventes de muffins (en dollars), avec $\mathbb{E}[M]=50$ et $\operatorname{Var}(M)=25$.
Les ventes de café et de muffins sont dépendantes, avec une covariance de $\operatorname{Cov}(C,M)=12$.
Exemple
Un biologiste étudie la relation entre l'exposition au soleil et la croissance des plantes. La croissance d'une plante ($G$, en centimètres par semaine) dépend des heures d'ensoleillement ($H$, en heures par jour) qu'elle reçoit. La relation est modélisée comme suit: $$ G=2 H+5$$
où
$H$ : Heures d'ensoleillement par jour, avec $\mathbb{E}[H]=6$ et $\operatorname{Var}(H)=1.5$.
$G$ : Croissance des plantes (en $cm/$ semaine), qui dépend de $H$.
Distribution Binomiale
Définition:
Variable Aléatoire Binomiale
Caractéristiques d'une Expérience Binomiale
La Moyenne et la Variance d'une Variable Aléatoire Binomiale
Formule:
Moyenne d'une Variable Aléatoire Binomiale
Formule:
Variance et Écart-type d'une Variable Aléatoire Binomiale
Exemple 1
Il y a quelque chose chez les hommes grands qui rend les femmes irrésistibles. Une analyse des données obtenues de Yahoo! a révélé que pour les femmes, la taille est un facteur important lorsqu'il s'agit de décisions sur les rencontres. En fait, seuls $8 \%$ des femmes envisageraient de sortir avec un homme plus petit que $5^{\prime} 8''$.
Parmi les 10 prochaines femmes que vous rencontrez, quelle est la probabilité que exactement quatre d'entre elles envisagent de sortir avec un homme plus petit que $5^{\prime}8''$?
Soit $X$ le nombre de femmes qui envisageraient de sortir avec un homme plus petit que $5'8''$
La pmf est $$P(X=x)=C^{10}_x\cdot (0.08)^x\cdot (1-0.08)^{10-x}\quad;\quad X=0,1,\dots,10$$
La probabilité que exactement quatre d'entre elles envisagent de sortir avec un homme qui mesure moins de $5'8''$ est $P(X=4)=C^{10}_4\cdot (0.08)^4\cdot (0.92)^6=0.236$
Solution
Exemple 2
Une enquête menée par la National Sleep Foundation a révélé que $40\%$ des Américains dorment moins que la quantité recommandée. Si 10 Américains sont choisis au hasard, quelle est la probabilité que exactement 3 d'entre eux dorment moins que la quantité recommandée?
Soit $X$ le nombre d'Américains qui dorment moins que la quantité recommandée.
La pmf est $$P(X=x)=C^{10}_x\cdot (0.4)^x\cdot (0.6)^{10-x}\quad;\quad X=0,1,\dots,10$$
La probabilité que exactement 3 d'entre eux dorment moins que la quantité recommandée est $P(X=3)=C^{10}_3\cdot (0.4)^3\cdot (0.6)^7=0.215$
Solution
Exemple Long 1
Lors d'un voyage en Finlande en 2005, le Premier ministre italien, Silvio Berlusconi, a insulté le pays en disant que les Finlandais ne mangeaient rien d'autre que de la viande de renne marinée et que leur cuisine était quelque chose à ``endurer`` et non à apprécier. Ne voulant pas laisser passer l'insulte, les Finlandais ont participé à un concours international de pizza et ont remporté la première place. Leur entrée gagnante, qui mettait en vedette des champignons sauvages et du renne fumé, s'appelait ``Pizza Berlusconi``. La vengeance n'a jamais eu aussi bon goût!
Un récent sondage a révélé que $80\%$ des Finlandais commandaient régulièrement la Pizza Berlusconi lorsqu'ils mangeaient à l'extérieur. Dans un restaurant de pizza à Helsinki, six personnes s'apprêtent à déjeuner.
Exemple
Ark Encounter, une réplique de l'arche de Noé / parc à thème de plusieurs millions de dollars à Williamstown, Kentucky, est tout au sujet de survivre aux inondations... théoriquement. Alors que l'arche originale était conçue pour résister à 40 jours et 40 nuits de pluie, la version du Kentucky n'a pas tout à fait été à la hauteur du battage médiatique. Il s'avère qu'après 40 à 50 pouces de pluie tombés en mai '24, l'arche elle-même a été victime de dégâts dus aux inondations.
Dans un retournement de situation si ironique qu'il semble divinement écrit, les avocats d'Ark Encounter poursuivent maintenant leurs assureurs pour avoir refusé de couvrir les dommages causés par l'eau.
La probabilité qu'une compagnie d'assurance honore et indemnise un titulaire de police dont la propriété a été endommagée par une inondation est de $65 \%$. Dans les 30 prochaines réclamations où l'inondation était la cause des dommages matériels, quelle est
Exemple
En 2017, Lee De Paauw du Queensland, en Australie, a essayé d'impressionner une fille en sautant dans une rivière après avoir bu une grande quantité de vin. Il a immédiatement été attaqué par un crocodile de 3 mètres. Et malgré avoir réussi à repousser le crocodile, il n'a toujours pas réussi à obtenir un rendez-vous avec la fille qui l'intéressait.
Sur la base de données historiques, il y a 10% de chances de rencontrer un crocodile lorsqu'on entre dans une rivière spécifique. Dans un geste audacieux et discutable, un groupe de 15 casse-cou a décidé de sauter dans cette rivière infestée de crocodiles pour tester leur chance.