Chapitre 15. Probabilités conditionnelles

I. Probabilités conditionnelles

1) Découverte des probabilités conditionnelles

Dans un certain lycée, il y a $867$ élèves répartis comme suit :

Seconde Première Terminale Total
Filles 203 116 161 480
Garçons 140 134 113 387
Total 343 250 274 867

On choisit un élève au hasard. On note :

$F$ : \og l'élève choisi est une fille \fg
$G$ : \og l'élève choisi est une garçon \fg
$S$ : \og l'élève choisi est un élève de seconde \fg
$P$ : \og l'élève choisi est un élève de première \fg
$T$ : \og l'élève choisi est un élève de terminale \fg

La probabilité que l'élève choisi soit un élève de terminale est $\dfrac{274}{867}=0,316\ldots$ et la probabilité que cet élève soit une fille est $\dfrac{480}{867}=0,553\ldots$

$$p(T)=\dfrac{274}{867}=0,316\ldots\;\text{et}\;p(F)=\dfrac{480}{867}=0,553\ldots$$
Seconde Première Terminale Total
Filles 203 116 161 480
Garçons 140 134 113 387
Total 343 250 274 867

Si on choisit cet élève parmi les filles uniquement, la probabilité qu'il soit un élève de terminale est $\dfrac{161}{480}=0,335\ldots$ On a ainsi considéré uniquement les $480$ élèves qui sont des filles. Cette dernière probabilité est une probabilité conditionnelle : c'est la probabilité que l'élève choisi soit un élève de terminale conditionnée par le fait que cet élève est une fille.
Dit autrement, on a calculé la probabilité que l'élève choisi soit un élève de terminale sachant que cet élève est une fille. On note $p_F(T)$ (et on lit \og la probabilité de $T$ sachant $F$ \og)

$$p_F(T)=\dfrac{161}{480}=0,335\ldots$$
Seconde Première Terminale Total
Filles 203 116 161 480
Garçons 140 134 113 387
Total 343 250 274 867

Il faut bien distinguer cette probabilité de la probabilité de l'événement \og l'élève choisi est une fille de terminale \fg~qui est l'événement $F\cap T$. Pour ce dernier événement, on considère de nouveau les $867$ élèves. Parmi ces $867$ élèves, il y en a $161$ qui sont des élèves des filles en classe de terminale.

$$p\left(F\cap T\right)=\dfrac{161}{867}=0,185\ldots$$
Seconde Première Terminale Total
Filles 203 116 161 480
Garçons 140 134 113 387
Total 343 250 274 867

Il y a un lien entre les différentes probabilités calculées plus haut.

$$p_F(T)=\dfrac{161}{480}=\dfrac{\dfrac{161}{867}}{\dfrac{480}{867}}=\dfrac{p\left(F\cap T\right)}{p(F)}$$

ou aussi

$$p(F)\times p_F(T)=\dfrac{480}{867}\times\dfrac{161}{480}=\dfrac{161}{867}=p\left(F\cap T\right)$$

On sait qu'une telle situation peut se représenter par un arbre de probabilités.

image/svg+xmlF G SP T SPT

Les probabilités du premier niveau de l'arbre à savoir $p(F)=\dfrac{480}{867}$ et $p(G)=\dfrac{387}{867}$ sont des probabilités calculées sur l'ensemble des élèves.
Les probabilités écrites au deuxième niveau de l'arbre sont des probabilités conditionnelles. Par exemple, les probabilités associées aux branches partant de $F$ sont respectivement $p_F(S)=\dfrac{203}{480}$, $p_F(P)=\dfrac{116}{480}$ et $p_F(T)=\dfrac{161}{480}$.
Le nombre $\dfrac{161}{480}$ n'est donc pas la probabilité de $T$ mais est la probabilité de $T$ sachant que l'événement $F$ est réalisé.

Si on veut à partir de cet arbre calculer la probabilité d'une intersection d'événements comme $p\left(G\cap P\right)$ par exemple, c'est-à-dire la probabilité que l'élève choisi soit un garçon en classe de première, on multiplie les probabilités écrites le long du chemin passant par $G$ et finissant à $P$ :

$$p\left(G\cap P\right)=p(G)\times p_G(P)=\dfrac{387}{867}\times\dfrac{134}{387}=\dfrac{134}{867}$$

Si on veut à partir de cet arbre calculer la probabilité d'un événement écrit au deuxième niveau de l'arbre comme $p(T)$ par exemple, c'est-à-dire la probabilité que l'élève choisi soit un élève de terminale, on \og récupère l'événement $T$ en plusieurs morceaux \fg~en additionnant les probabilités de chacun des chemins menant à $T$ :

\begin{align*} p(T)&=p\left(F\cap T\right)+p\left(G\cap T\right)=p(F)\times p_F(T)+p(G)\times p_G(T)=\dfrac{480}{867}\times\dfrac{203}{480}+\dfrac{387}{867}\times\dfrac{113}{387}\\ &=\dfrac{203}{867}+\dfrac{113}{867}=\dfrac{274}{867} \end{align*}

Cette dernière formule est connue sous le nom de formule des probabilités totales. Elle est très utilisée dans les exercices du bac S sur les probabilités conditionnelles et sera exposée plus loin dans sa version générale.

2) Définition de la probabilité de $A$ sachant $B$

On suppose donné un univers $\Omega$ (ensemble des issues d'une expérience aléatoire ou encore ensemble des événements élémentaires ) fini et une loi de probabilité $p$ sur $\Omega$.

Définition 1.

Soient $A$ et $B$ deux événements tels que $p(A)\neq0$.
La probabilité de l'évenement $B$ sachant que l'événement est réalisé est :
$p_A(B)=\dfrac{p\left(A\cap B\right)}{p(A)}$.
$p_A(B)$ se lit \og probabilité de B sachant A \fg.

On en déduit immédiatement que

Théorème 1.

Soient $A$ et $B$ deux événements tels que $p(A)\neq0$.
$p\left(A\cap B\right)=p(A)\times p_A(B)$.

3) Propriétés des probabilités conditionnelles

0n admet que la probabilité conditionnelle $P_A$ vérifie toutes les propriétés usuelles des lois de probabilité :

Théorème 2.

Soit $A$ un évenement tel que $p(A)\neq0$.
  1. Pour tout événement $B$, $0\leqslant p_A(B)\leqslant1$.
  2. $p_A\left(\varnothing\right)=0$ et $p_A\left(\Omega\right)=1$.
  3. Pour tout événement $B$, $p_A\left(\overline{B}\right)=1-p_A(B)$.
  4. Si $B$ et $C$ sont deux événements incompatibles, alors $p_A(B\cup C)=p_A(B)+p_A(C)$.

4) Utilisation d'un arbre pondéré

On énonce ici les différentes règles de construction d'un arbre de probabilités permettant de modéliser certaines expériences aléatoires.

image/svg+xml Niveau1Niveau2

Règle \no1. A l'origine de l'arbre ou encore au \og n\oe ud \fg~initial complètement à gauche, on a l'événement certain c'est-à-dire l'univers $\Omega$. Dans la pratique, $\Omega$ n'est jamais écrit explicitement.

Règle \no2. A partir d'un n\oe ud de l'arbre, on dessine des \og branches \fg. Dans l'arbre ci-dessus, deux branches partent de $\Omega$ vers les événements $A$ et $\overline{A}$. Dans le cas général, on décompose l'événement certain $\Omega$ en $n$ événements $A_1$, $A_2$, \ldots , $A_n$ deux à deux incompatibles dont la réunion est égale à $\Omega$. On recommence ensuite ce processus à chaque niveau. Ci-dessous, un arbre à deux niveaux ce qui est systématiquement le cas dans les exercices de bac S.

image/svg+xml

Règle \no3. Au niveau 1, on place sur chaque branche, la probabilité de l'évenement se trouvant au bout de la branche.
Au niveau 2, sur une branche allant d'un événement $E$ à un événement $F$, on place $p_E(F)$ la probabilité de l'événenement $F$ sachant l'événement $E$.
On note que le principe est le même au niveau 1. Les probabilités écrites sont les

$$p_{\Omega}(A)=\dfrac{p\left(A\cap\Omega\right)}{p\left(\Omega\right)}=\dfrac{p(A)}{1}=p(A).$$

Si on avait un troisième niveau comme ci-dessous, on placerait sur la branche allant de $B$ à $C$, la probabilité de $C$ sachant $A\cap B$.

image/svg+xml

Règle \no4. La somme des probabilités inscrites sur les branches partant d'un même n\oe ud est égale à $1$. Ci-dessous, un n\oe ud avec deux branches.

image/svg+xml

Règle \no5. Une succession de plusieurs branches s'appelle un chemin. Un chemin représente l'intersection des différents événements rencontrés le long de ce chemin. La probabilité de cette intersection est alors le produit des probabilités des événements rencontrés le long de ce chemin.

image/svg+xml

II. La formule des probabilités totales

Définition 2.

Soit $E$ un ensemble. Soeint $A_1$, $A_2$, \ldots $A_n$, des parties de $E$.
On dit que $A_1$, $A_2$, \ldots $A_n$ forment une \textbf{partition} de $E$ si et seulement si
  1. aucune des parties $A_1$, \ldots , $A_n$ n'est vide,
  2. les parties $A_1$, \ldots , $A_n$ sont deux à deux disjointes,
  3. la réeunion des parties $A_1$, $A_2$, \ldots et $A_n$ est $E$.
image/svg+xml ...

Si on réexprime le vocabulaire précédent en termes de probabilités. $E$ devient un univers $\Omega$ et $A_1$, \ldots , $A_n$ sont des événements. Si aucun des événements $A_1$, \ldots , $A_n$ n'a une probabilité égale à $0$, si les événements $A_1$, \ldots , $A_n$ sont deux à deux incompatibles ($p(A_i\cap A_j)=0$ si $i\neq j$) et si la réunion des événements $A_1$, \ldots , $A_n$ est l'univers $\Omega$, on dit que les événements $A_1$, \ldots , $A_n$ constituent un système complet d'événements.

Théorème 3 (formule des probabilités totales).

Soit $A_1$, \ldots , $A_n$ un système complet d'événements.
Pour tout événement $B$,
$p(B)=p(B\cap A_1)+\ldots+p(B\cap A_n)=p(A_1)\times p_{A_1}(B)+\ldots+p(A_n)\times p_{A_n}(B)$.
En particulier, pour tous événements $A$ et $B$ tels que $p(A)\neq0$ et $p\left(\overline{A}\right)\neq0$,
$p(B)=p(B\cap A)+\ldots+p\left(B\cap \overline{A}\right)=p(A)\times p_{A}(B)+\ldots+p\left(\overline{A}\right)\times p_{\overline{A}}(B)$.

La formule ne fait qu'exprimer le fait que les événements $B\cap A_1$, \ldots , $B\cap A_n$ sont deux à deux disjoints et ont une réunion égale à $B$.

image/svg+xml
Exercice 1. (d'après France métropolitaine Bac S Juin 2011)
Les résultats seront donnés sous forme décimale en arrondissant à $10^{-4}$.

Dans un pays, il y a $2\%$ de la population contaminée par un virus.

On dispose d'un test de dépistage de ce virus qui a les propriétés suivantes :

- La probabilité qu'une personne contaminée ait un test positif est de 0,99 (sensibilité du test).
- La probabilité qu'une personne non contaminée ait un test négatif est de 0,97 (spécificité du test).

On fait passer un test à une personne choisie au hasard dans cette population.
On note $V$ l'événement \og la personne est contaminée par le virus \fg~et $T$ l'événement \og le test est positif \fg.
$\overline{V}$ et $\overline{T}$ désignent respectivement les événements contraires de $V$ et $T$.

    1. Préciser les valeurs des probabilités $P(V)$, $P_V (T)$, $P_{\overline{V}}(T)$.
      Traduire la situation à l'aide d'un arbre de probabilités.
    2. En déduire la probabilité de l'événement $V\cap T$.

  1. Démontrer que la probabilité que le test soit positif est $0,0492$.

    1. Justifier par un calcul la phrase :\og Si le test est positif, il n'y a qu'environ $40\%$ de \og chances \fg que la personne soit contaminée \fg.
    2. Déterminer la probabilité qu'une personne ne soit pas contaminée par le virus sachant que son test est négatif.

Solution.

    1. L'énoncé fournit directement $p(V)=0,02$, $p_V(T)=0,99$ et $p_{\overline{V}}\left(\overline{T}\right)=0,97$. Représentons la situation par un arbre.
      image/svg+xml

    2. On en déduit que $p\left(V\cap T\right)=p(V)\times p_V(T)=0,02\times0,99=0,0198$.

  1. La probabilité demandée est $p(T)$. D'après la formule des probabilités totales, $p(T)=p(T\cap V)+p\left(T\cap\overline{V}\right)$. D'après la question précédente, $p\left(V\cap T\right)=0,0198$ et d'autre part $$p\left(T\cap\overline{V}\right)=p\left(\overline{V}\right)\times p_{\overline{V}}(T)=(1-p(V))\left(1-p_{\overline{V}}\left(\overline{T}\right)\right)=(1-0,02)(1-0,97)=0,98\times0,03=0,0294 ,$$

    et donc $p(T)=0,0198+0,0294=0,0492$.


    1. La probabilité demandée est $p_T(V)$. Or,
      $p_T(V)=\dfrac{p(V\cap T)}{p(T)}=\dfrac{0,0198}{0,0492}=0,402\ldots$

      Donc $p_T(V)=0,4$ à $10^{-2}$ près ou encore $p_T(V)=40\%$ à $1\%$ près ce qui justifie la phrase de l'énoncé.


    2. La probabilité demandée est $p_{\overline{T}}\left(\overline{V}\right)$. Or, $$p_{\overline{T}}(\overline{V})=\dfrac{p\left(\overline{V}\cap\overline{T}\right)}{p\left(\overline{T}\right)}.$$

      Ensuite, d'après la question 2), $p(\overline{T})=1-p(T)=1-0,0492=0,9508$ et d'autre part

      $$p(\overline{V}\cap\overline{T})=p(\overline{V})\times p_{\overline{V}}(\overline{T})=0,98\times0,97=0,9506$$

      puis $p_{\overline{T}}\left(\overline{V}\right)=\dfrac{0,9506}{0,9508}=0,9998$ arrondi à $10^{-4}$.


Une activité classique sur les probabilités conditionnelles consiste à donner les probabilités conditionnelles inverses : l'énoncé donne entre autres $p_A(B)$ et demande en fin d'exercice $p_B(A)$. C'est le cas dans la quatrième question de l'exercice suivant :

Exercice 2. (D'après Bac S Polynésie Juin 2009)
Une entreprise fabrique des lecteurs MP3 dont $6\%$ sont défectueux.
Chaque lecteur MP3 est soumis à une unité de contrôle dont la fiabilité n'est pas parfaite.
Cette unité de contrôle rejette $98\%$ des lecteurs MP3 défectueux et $5\%$ des lecteurs MP3 fonctionnant correctement.

On note :

$D$ l'événement \og le lecteur MP3 est défectueux \fg~;
$R$ l'événement \og l'unité de contrôle rejette le lecteur MP3 \fg.

  1. Faire un arbre pondéré sur lequel on indiquera les données qui précèdent.

    1. Calculer la probabilité que le lecteur soit défectueux et ne soit pas rejeté.
    2. On dit qu'il y a erreur de contrôle lorsque le lecteur MP3 est rejeté alors qu'il n'est pas défectueux,
      ou qu'il n'est pas rejeté alors qu'il est défectueux.
      Calculer la probabilité qu'il y ait erreur de contrôle.

  2. Montrer que la probabilité qu'un lecteur MP3 ne soit pas rejeté est égale à $0,8942$.

  3. Calculer la probabilité que le lecteur MP3 ne soit pas défectueux sachant qu'il n'est pas rejeté.

Solution.

  1. Représentons la situation par un arbre.
    image/svg+xml

    1. La probabilité demandée est $p(D\cap\overline{R})$. Or $$p\left(D\cap\overline{R}\right)=p(D)\times p_{D}\left(\overline{R}\right)=p(D)\times(1-p_D(R))=0,06\times0,02=0,0012.$$

      La probabilité que le lecteur soit défectueux et ne soit pas rejeté est $0,0012$.


    2. La probabilité demandée est $p\left(\left(R\cap\overline{D}\right)\cup\left(\overline{R}\cap D\right)\right)=p\left(R\cap\overline{D}\right)+p\left(\overline{R}\cap D\right)$ car les événements $R\cap\overline{D}$ et $\overline{R}\cap D$ sont incompatibles.

      On a déjà $p\left(\overline{R}\cap D\right)=0,0012$. Il manque

      $$p\left(R\cap\overline{D}\right)=p\left(\overline{D}\right)\times p_{\overline{D}}(R)=(1-p(D))\times p_{\overline{D}}(R)=0,94\times0,05=0,047,$$

      et donc $p(R\cap\overline{D})+p(\overline{R}\cap D)=0,0012+0,047=0,0482$.

      La probabilité qu'il y ait erreur de contrôle est $0,0482$.


  2. La probabilité demandée est $p(\overline{R})$. D'après la formule des probabilités totales,
    $p(\overline{R})=p\left(\overline{R}\cap D\right)+p\left(\overline{R}\cap\overline{D}\right)=0,0012+p\left(\overline{D}\right)\times p_{\overline{D}}\left(\overline{R}\right)=0,0012+0,94\times(1-0,05)=0,8942$.

    La probabilité qu'un lecteur MP3 ne soit pas rejeté est $0,8942$.


  3. La probabilité demandée est $p_{\overline{R}}\left(\overline{D}\right)$. Or \begin{align*} p_{\overline{R}}\left(\overline{D}\right)&=\dfrac{p\left(\overline{D}\cap\overline{R}\right)}{p\left(\overline{R}\right)}=\dfrac{p\left(\overline{D}\right)\times p_{\overline{D}}\left(\overline{R}\right)}{p(\left(\overline{R}\right)}=\dfrac{\left(1-p(D)\right)\times\left( 1-p_{\overline{D}}\left(R\right)\right)}{p(\left(\overline{R}\right)}\\ &=\dfrac{(1-0,06)\times(1-0,05)}{0,8942}=\dfrac{0,893}{0,8942}=0,998\ldots. \end{align*}

    La probabilité que le lecteur MP3 ne soit pas défectueux sachant qu'il n'est pas rejeté est $0,998$ à $10^{-3}$ près.


III. Indépendance de deux événements

Définition 3.

Soient $A$ et $B$ deux événements.
$A$ et $B$ sont \textbf{indépendants} si et seulement si $p\left(A\cap B\right)=p(A)\times p(B)$.

Théorème 4.

Soient $A$ et $B$ deux événements de probabilités respectives non nulles.
$A$ et $B$ sont indépendants si et seulement si $p_A(B)=p(B)$.
$A$ et $B$ sont indépendants si et seulement si $p_B(A)=p(A)$.

Démonstration. Puisque $p(A)\neq0$, $p\left(A\cap B\right)=p(A)\times p_A(B)$. Par suite, \begin{align*} p\left(A\cap B\right)=p(A)\times p(B)&\Leftrightarrow p(A)\times p_A(B)=p(A)\times p(B)\\ &\Leftrightarrow p_A(B)=p(B)\;(\text{car}\;p(A)\neq0. \end{align*}


Commentaire. C'est le théorème précédent qui permet de vraiment comprendre la notion d'événements indépendants. $A$ et $B$ sont indépenandants si et seulement si la probabilité de $B$ sachant $A$ est égale à la probabilité de $A$. Ceci équivaut à dire que la réalisation ou la non réalisation de l'évenement $A$ n'a pas d'influence sur la probabilité de l'événement $B$ et vice versa. Nous aurions pu prendre l'énconcé du théorème pour définition de l'indépendance de deux événements. Cela aurait rendu tout de suite plus claire la notion d'indépendance de deux événements mais cela présentait un défaut : le théorème a été fourni avec la condition restrictive $p(A)\neq0$ (ou $p(B)\neq0$) ce qui n'est pas le cas dans la définition adoptée.

Exemple. Une urne contient $2$ boules noires et $8$ blanches et donc $10$ boules au total.
On tire deux boules de cette urne. On note $A$ l'événement \og la première boule tirée est noire \fg~et $B$ l'événement \og la deuxième boule tirée est noire \fg.

Si le tirage de ces deux boules s'effectue successivement avec remise de la boule tirée dans l'urne, la probabilité de $B$ est $\dfrac{2}{10}$ et ceci quelle que soit la couleur de la boule tirée en premier. Dans cette situation les événements $A$ et $B$ sont indépendants.

Si le tirage de ces deux boules s'effectue successivement sans remise de la boule dans l'urne, la probabilité de $B$ est $\dfrac{2}{9}$ si la première boule tirée est blanche et $\dfrac{1}{9}$ si la première boule tirée est noire. La probabilité de $B$ varie en fonction de la réalisation ou de la non réalisation de l'événement $A$. Dans cette situation les événements $A$ et $B$ ne sont pas indépendants.

Théorème 5.

Soient $A$ et $B$ deux événements de probabilités.
Si $A$ et $B$ sont indépendants, alors $\overline{A}$ et $B$ sont indépendants.

Démonstration. Soient $A$ et $B$ deux événements indépendants.

D'après la formule des probabilités totales, $p(B)=p\left(A\cap B\right)+p\left(\overline{A}\cap B\right)$ et donc

\begin{align*} p\left(\overline{A}\cap B\right)=p(B)-p\left(A\cap B\right)\\ &=p(B)-p(A)\times p(B)\;(\text{car}\;A\;\text{et}\;B\;\text{sont indépendants})\\ &=(1-p(A))\times p(B)=p\left(\overline{A}\right)\times p(B), \end{align*}

et donc les événements $\overline{A}$ et $B$.


Commentaire. Si $A$ et $B$ sont deux événements indépenants, en appliquant le théorème précédent aux événements $B$ et $A$, on obtient le fait que les événements $A$ et $\overline{B}$ sont indépendants et en appliquant aux événements $B$ et $\overline{A}$, on obtient le fait que les événements $\overline{A}$ et $\overline{B}$ sont indépendants.

Exercice 3. (D'après Bac S Polynésie Juin 2005 enseignement obligatoire).
Une usine d'horlogerie fabrique une série de montres.
Au cours de la fabrication peuvent apparaître deux types de défauts, désignés par $a$ et $b$.
$2\%$ des montres fabriquées présentent le défaut $a$ et $10\%$ présentent le défaut $b$.

Une montre est tirée au hasard dans la production. On définit les événements suivants :

$A$ : \og la montre tirée présente le défaut $a$ \fg~;
$B$ : \og la montre tirée présente le défaut $b$ \fg~;
$C$ : \og la montre tirée ne présente aucune défaut \fg~;
$D$ : \og la montre tirée présente un et un seul des deux défauts \fg.

On suppose les événements $A$ et $B$ indépendants.

  1. Montrer que la probabilité de l'événement $C$ est égale à $0,882$.

  2. Calculer la probabilité de l'événement $D$.

Solution.

  1. La probabilité demandée est $p\left(\overline{A}\cap\overline{B}\right)$.

    L'énoncé donne $p(A)=0,02$ et $p(B)=0,1$. Puisque les événements $A$ et $B$ sont indépendants, on sait que les événements $\overline{A}$ et $\overline{B}$ sont aussi indépendants et donc

    $$p\left(\overline{A}\cap\overline{B}\right)=p\left(\overline{A}\right)\times p\left(\overline{B}\right)=(1-p(A))(1-p(B))=0,98\times0,9=0,882.$$

    $p(C)=0,882$.


  2. Une montre choisie au hasard peut
    • ou bien ne présenter aucun défaut (événement $C$)
    • ou bien présenter un et un seul des deux défauts (événement $D$)
    • ou bien présenter les deux défauts (événement $A\cap B$),

    ces trois événements étant deux à deux disjoints. D'après la formule des probabilités totales, on a

    $$p(C)+p(D)+p(A\cap B)=1$$

    et donc, puisque les événements $A$ et $B$ sont indépendants,

    $$p(D)=1-p(C)-p(A\cap B)=1-p(C)-p(A)\times p(B)=1-0,882-0,02\times0,1=1-0,882-0,002=0,116.$$

    $p(D)=0,116$.